THE EXPERT'S VOICE” IN OPEN SOURCE 


The Definitive Guide to 








Take contre! of ris connect but poiverfn! tool te embed 
sophisticated SOL databases whin your applications! 


Foreword by. 


‘creaky Tor pr ed 





SQLite 权威 指南 


目录 


SQLite 权 威 指南 0 
推荐 者 的 话 1 


wi 


x 
= 


€ SQLite 介 绍 
入 门 
关系 模型 
SQL 
设计 和 概念 
核心 C API 
扩充 C API 
言 扩展 
SQLite ^j 4% 


ee X 游 MM 
C1 > Co N =% 
dde = do db 


263 
第 了 对 
第 BS 
TE 


m 


* 
© oN Oa R OQ M 


3 


MN 


shee d : 
o 


3 
-— 
-— 


SQLite 权 威 指南 


The Definitive Guide to SQLite 
《内容 摘要 ) 

Michael Owens 

Copyright . 2006 by Michael Owens 


本 书 的 示例 代码 可 到 http://www.apress.com 下 载 。 


推荐 者 的 话 
最 近 对 SQLite 很 感 兴趣 ， 认 瘟 学 习 有 一 个 多 月 了 。 


学 习 时 基本 找 不 到 既 好 又 系统 的 中 文 文章 ， 也 买 不 到 好 的 中 文书 籍 ， 看 来 SQLite 在 国内 还 是 
不 够 流行 ， 这 么 好 的 东西 ， 可 惜 了 。 


以 我 中 等 偏 下 的 眼界 ，《The Definitive Guide to SQLite》 是 我 所 见 到 的 最 好 的 “SQLite 入 门 
+ 大 人 全” 了， 可惜 也 是 英文 的 。 实 在 找 不 到 别 的 ， 也 只 好 看 它 了 ， 尽 管 我 英语 很 不 好 。 


由 于 英语 很 不 好 ， 又 因为 是 打字 员 出 身 的 干部 ， 所 以 多 年 来 养 成 了 一 个 更 不 好 的 毛病 ， 就 是 
在 不 得 不 看 英文 资料 时 总 喜欢 一 边 看 一 边 翻 ， 主 要 是 怕 下 次 再 看 时 还 是 看 不 懂 。 看 《The 
Definitive Guide to SQLite》 时 这 个 毛病 也 没 改 ， 当 然 了 ， 看 的 时 候 就 是 挑 着 看 的 ， 翻 的 也 只 
是 书 中 的 一 小 部 分 了 。 


一 般 情况 下 看 完 也 就 看 完了 ， 很 少 有 "下 次 再 看 "的 机 会 ， 这 次 例外 。 由 于 越 学 越 觉 着 SQLite 好 
玩 ， 就 想 向 身边 的 人 也 介绍 一 下 ， 就 “再 看 "了 。 越 看 越 盖 愧 ， 本 来 英语 就 差 ， 还 随 看 随 翻 ， 结 
果 可 想 而 知 。 但 由 于 没什么 动力 ， 也 就 无 意 再 重新 润色 了 ， 就 这 样 吧 ， 反 正 也 没什么 人 看 ， 
估计 遗 害 不 会 太 广 。 


SQLite 是 没有 版 权 的 ， 但 这 本 书 却 是 受 版 权 保护 的 ， 也 不 知 我 这 样 做 是 否 合法 。 发 到 网 上 也 
只 是 想 做 一 个 好 事 ， 响 应 SQLite 的 共享 精神 。 估 计 不 会 有 人 来 告 我 吧 ， 反 正 我 没 钱 。 另 外 ， 
我 也 只 翻译 了 书 中 很 小 的 一 部 分 ， 也 许 根本 算 不 上 翻译 (不 能 乱 抬 高 自己 ) c Ret 
SQLite 和 《The Definitive Guide to SQLite》 一 书 的 一 个 推荐 吧 ， 同 样 对 SQLite 感 兴趣 但 又 看 
不 懂 我 的 中 文 的 兄弟 ， 强 烈 建议 看 原文 。 感 谢 Richard Hipp 编 出 这 么 好 的 程序 ， 感 谢 Michael 
Owens 写 出 这 么 好 的 书 。 


“空转 ”只 是 我 的 网 名 之 一 ， 网 上 网 下 知之 者 其 少 ， 也 就 是 一 起 骑 车 的 几 个 人 知道 吧 。 如 果 本 文 
对 您 能 有 一 点 点 帮助 ， 也 算是 我 对 SQLite 做 了 一 点 贡献 吧 。 本 文中 带 有 “ 空 注 "的 内 容 是 我 个 人 
所 做 的 简单 说 明和 慎 悔 ， 与 原作 者 无 关 (以 我 的 翻译 水 平 ， 估 计 全 文 跟 原作 者 都 没什么 
X)? 

iE ARSQLitetH IBI € > PEU SCOSE fe eH AR $E o REKBREKR? GERI KPI o te 
果 有 兄弟 想 对 我 提出 指导 ， 我 的 邮箱 是 : njgaoyi@yahoo.com.cn。 如 果 我 没有 回信 ， 不 是 因 
为 不 想 回 ， 是 因为 我 很 少 上 网 ， 在 此 先行 谢 过 。 

分 析 源 程序 时 ， 发 现 每 个 SQLite 源 文件 的 头 部 都 有 这 样 一 段 话 : 

The author disclaims copyright to this source code. In place of a legal notice, here is a 
blessing: 


May you do good and not evil. 


May you find forgiveness for yourself and forgive others. 


May you share freely, never taking more than you give. 
LILA iE AR So HERG RMERLHKRG? 5X 
Ver 1.00: 2009-11-07 于 南京 


(如 果 以 后 有 时 间 、 兴 趣 ， 就 把 翻译 过 的 内 容 好 好 修改 一 下 ， 或 者 再 多 翻 一 些 。 但 愿 还 有 以 
后 的 版 本 ) 


2000 年 春天 ， 当 我 刚 开 始 编写 SQLite 时 ， 根 本 没 想 到 它 会 在 编程 社区 受到 如 此 强烈 的 认可 。 
今天 ， 有 成 百 万 的 SQLite 拷 贝 在 默默 地 运行 ， 在 计算 机 中 ， 或 在 不 同 公司 生产 的 各 种 各 样 的 
小 设备 中 。 你 可 能 已 经 在 无 意识 的 情况 下 使 用 过 SQLite， 在 你 的 手机 、MP3 或 机 顶 盒 里 可 能 
就 有 SQLite。 在 你 的 计算 机 里 也 可 能 至 少 会 有 一 个 SQLite 的 拷贝 ， 它 可 能 来 自 Apple 的 Mac 
OS X， 或 者 在 大 多 数 的 Linux 版 本 中 ， 或 者 在 Windows 中 安装 某 个 第 三 方 软件 时 。 很 多 Web 网 
站 的 后 台 都 使 用 SQLite， 这 要 感谢 它 已 经 被 包含 为 PHP5 语 言 的 一 部 分 。SQLite 也 被 用 于 很 多 
航空 电子 设备 、 建 模 和 仿 丨 程序 、 工 业 控 制 、 智 能 卡 、 决 策 支持 包 、 医 药 信 息 系 统 等 。 因 为 
没有 SQLite 使 用 的 全 面 报告 ， 所 以 ， 肯 定 还 有 很 多 我 不 知道 的 SQLite 部 署 。 


SQLite 的 普及 很 大 程度 上 应 该 归功 于 Michael Owens。Mike 在 The Linux Journal (June 2003) 
和 The C/C++ Users Journal (March 2004) 上 的 文章 吸引 了 无 数 程序 员 。 每 篇 文章 发 表 后 ， 
SQLite 网 站 的 访问 量 都 会 显著 上 升 。 通 过 这 本 书 你 可 以 看 到 Mike 的 才华 和 他 所 做 的 大 量 工 

作 ， 相 信 你 不 会 失望 。 本 书包 含 了 关于 SQLite 所 需要 了 解 的 所 有 内 容 ， 你 应 该 一 直 把 它 放 在 
伸手 可 及 的 地 方 。 


SQLite 是 自由 软件 。 尽 管 我 是 它 的 架构 师 和 代码 的 主要 编写 者 ， 但 SQLite 并 不 是 我 的 程序 。 
SQLite 不 属于 任何 人 ， 也 不 在 版 权 的 保护 范围 之 内 。 所 有 曾经 为 SQLite 项 目 贡 献 过 代码 的 人 
都 签署 过 一 个 宣誓 书 将 他 们 的 贡献 发 布 到 公共 域 ， 我 把 这 些 宣誓 书 的 原件 保存 在 办 公 室 的 保 
险 箱 里 。 我 还 尽力 保证 在 SQLite 中 不 使 用 专利 算法 ， 这 些 预防 措施 意味 着 你 可 以 以 任何 形式 
使 用 SQLite， 而 不 需要 付 版 税 、 许 可 证 费用 或 受到 其 它 任何 限制 。 


SQLite 仍 然 在 发 展 。 但 我 和 其 他 开发 者 都 坚守 它 的 核心 价值 。 我 们 将 保持 代码 的 小 规模 一 一 
核心 库 不 会 超过 250KB。 我 们 将 保持 公共 API 和 文件 格式 的 向 上 兼容 性 。 我 们 将 继续 保证 
SQLite 是 充分 测试 的 和 无 bug 的 。 我 们 希望 你 总 是 能 够 将 新 版 本 的 SQLite 放 到 你 老 的 程序 中 ， 
既得 到 它 新 的 特性 和 优化 ， 又 不 需要 或 仅 需 要 很 少 的 代码 改动 ， 且 不 需要 做 进一步 的 调试 。 
2004 年 ， 我 们 将 SQLite 从 版 本 2 升级 到 版 本 3 时 确实 没 能 保持 向 上 兼容 性 ， 但 从 那 以 后 ， 我 们 
已 经 能 够 达到 上 述 所 有 目标 并 准备 在 将 来 继续 这 样 做 。 没 有 SQLite 版 本 4 的 计划 。 


监 诚 希望 你 觉 着 SQLite 是 有 用 的 ， 我 代表 SQLite 的 所 有 贡献 者 保证 ， 使 用 SQLite 你 会 : 做 出 
美好 的 产品 ， 你 的 产品 将 会 是 快速 、 稳 定 和 易 用 的 。 寻 求 宽 起 并 宽恕 他 人 。 国 为 你 已 经 免费 
地 得 到 了 SQLite， 也 请 你 免费 地 给 予 他 人 一 些 东西 作为 回报 。 做 一 回 志 愿 者 ， 贡 献 出 其 它 的 
软件 项 目 或 找到 其 它 途 径 来 回报 。 


Richard Hipp 
Charlotte, NC 


April 11, 2006 
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紧凑 性 、 有 效 性 和 可 靠 性 方面 有 突出 的 表现 。 


内 嵌 式 数据 库 


SQLite 是 一 个 内 襄 式 的 数据 库 。 


数据 库 服务 器 就 在 你 的 程序 中 ， 其 好 处 是 不 需要 网 络 配 置 和 管理 。 数 据 库 的 服务 器 和 客户 端 
运行 在 同一 个 进程 中 。 这 样 可 以 减少 网 络 访问 的 消耗 ， 简 化 数据 库 管 理 ， 使 你 的 程序 部 署 起 
来 更 容易 。 所 有 需要 你 做 的 都 已 经 和 你 的 程序 一 起 编译 好 了 。 


如 图 1-1 所 示 。 一 个 Perl 脚 本 、 一 个 标 PHP 编 写 的 Apache 进 程 都 使 用 
SQLite。Perl 脚 本 导入 DBI::SQLite 模 板 ， 并 通过 它 来 访问 C APl。PHP 采 用 与 C 相 似 的 方式 访 
问 C API。 总 之 ， 它 们 都 需要 访问 C AP1。 尽 管 它们 每 个 进程 中 都 有 独立 的 数据 库 服务 器 ， 但 
eae 同 的 数据 库 文 件 。SQLite 利 用 操作 系统 功能 来 完成 数据 的 同步 和 加 锁 。 
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E Wpp HLA S HA ARS PER S X S AE JE P is Sybase SQL Anywhere ` 
InterSystems Caché ` Pervasive PSQL 和 微软 的 Jet Engine。 有 些 厂 家 从 他 们 的 大 型 数据 库 
产品 翻新 出 内 贬 式 的 变种 ， 如 |BM 的 DB2 Everyplace、Oracle 的 10g 和 微软 的 SQL Server 


Desktop Engine » 7t 7& 4) 344% Æ MySQL $ Firebird #6 4€ BE A aR AHH A o 4E PT OR oP > 
仅 有 两 个 是 完全 开放 源 代码 的 且 不 收 许 可 证 费用 一 一 Firebird 和 SQLite。 在 这 两 个 当中 ， 仅 有 
一 个 是 专门 为 内 幅 式 应 用 设计 的 一 一 SQLite 。 


开发 者 的 数据 库 


SQLite 具 有 多 方面 的 特性 。 它 是 一 个 数据 库 ， 一 个 程序 库 ， 一 个 命令 行 工具 ， 也 是 一 个 学 习 
关系 型 数据 库 的 很 好 的 工具 。 确 实 有 很 多 途径 可 以 使 用 它 一 一 内 骸 环境、 网站、 操作 系 统 服 
务 、 脚 本 语言 和 应 用 程序 。 对 于 程序 员 来 说 ，SQLite 就 象 一 个 数据 传送 带 ， 提 供 了 一 种 方便 
的 将 应 用 程序 绑 定 的 数据 的 方法 。 就 象 传送 带 一样 ， 对 SQLite 的 使 用 没有 终点 。 


除了 仅仅 作为 一 个 存储 容器 ，SQLite 还 可 以 作为 一 个 单纯 的 数据 处 理 的 工具 。 如 果 大 小 和 复 
杂 性 合适 ， 使 用 SQLite 可 以 很 容易 地 将 应 用 程序 所 使 用 的 数据 结构 转化 为 表 ， 并 保存 在 一 个 
内 在 数据 库 中 。 用 此 方法 ， 你 可 以 操作 互相 关联 的 数据 ， 可 以 完成 很 繁重 的 任务 页 不 必 写 自 
己 的 算法 来 对 数据 结构 操作 和 排序 。 如 果 你 是 一 个 程序 员 ， 想 像 一 下 在 你 的 程序 中 自行 完成 
下 面 SQL 语句 所 代表 的 工作 需要 多 少 代码 : 


SELECT AVG(z-y) FROM table GROUP BY x 
HAVING x > MIN(z) OR x < MAX(y) 
ORDER BY y DESC LIMIT 10 OFFSET 3; 


SQLite 还 是 一 个 很 好 的 学 习 程 序 设计 的 工具 ， 通 过 它 可 以 研究 很 多 计算 机 科学 的 课题 。 分 析 
器 、 分 词 器 、 虚 拟 机 、Btree 算 法 、 高 整 缓存 、 程 序 体系 结 构 ， 通 过 这 些 内 容 可 以 摘 清 楚 很 多 
计算 机 科学 的 经 典 概念 。SQLite 的 模块 化 、 小 型 化 和 简易 性 ， 使 你 可 以 很 容易 地 专门 研究 其 
中 的 一 个 问题 。 


管理 员 的 数据 库 


SQLite 不 仅 是 程序 员 的 数据 库 ， 它 对 系统 管理 员 也 很 有 用 。 它 很 小 、 紧 凑 而 精致 ， 就 像 一 些 
Unix 的 常用 工具 ， 如 find、rsync 或 grep。SQLite 提 供 了 命令 行 工 具 供用 户 交互 操作 。 


另外 ， 对 于 关系 型 数据 库 的 初学 者 来 说 ，SQLite 是 一 个 学 习 各 种 关系 相关 概念 的 方便 的 学 习 
工具 。 它 可 以 很 快 很 容易 地 安装 在 各 类 操作 系统 中 ， 它 的 数据 库 文件 可 以 自由 共享 页 不 需要 
任何 转换 。 它 具有 关系 型 数据 库 的 各 种 特色 而 又 不 令 人 生 情 。 它 的 程序 和 数据 库 文件 仅 用 U 盘 
就 能 传递 。 


SQLite 的 历史 


从 某 个 角度 来 说 ，SQLite 最 初 的 构思 是 在 一 条 军舰 上 进行 的 。SQLite 的 作者 D. Richard Hipp 
当时 正在 为 美国 海军 编制 一 种 使 用 在 导弹 驱逐 舰 上 的 程序 。 那 个 程序 最 初 是 运行 在 Hewlett- 
Packard Unix (HPUX) 上 ， 后 台 使 用 Informix 数 据 库 。 对 那个 程序 来 党 ，lnformix 有 点 儿 太 强大 


了 。 一 个 有 经 验 的 数据 库 管 理 员 (DBA) 可 能 需要 一 整 天 来 对 它 进 行 安装 和 升级 ， 如 果 没 经 验 ， 
这 个 工作 就 可 能 永远 也 做 不 完了 。 


2000 年 一 月 ，Hipp 开 始 和 一 个 同事 讨论 关于 创建 一 个 简单 的 内 些 式 SQL 数据 库 的 想法 ， 这 个 
数据 库 将 使 用 GNU DBM B-Tree library (gdbm) 做 后 台 ， 同 时 这 个 数据 库 将 不 需要 安装 和 管理 
支持 。 后 来 ， 当 有 些 空间 时 间 时 ，Hipp 就 开始 实施 这 项 工作 ， 并 在 2000 年 的 和 八 月 份 发 布 了 
SQLite 的 1.0 版 。 


按照 原 定 计划 ，SQLite 1.0 用 gdbm 来 做 存储 管理 。 但 后 来 ，Hipp 很 快 就 换 成 了 自己 的 B- 
tree， 以 支持 事务 和 记录 按 主键 的 存储 。 随 着 最 初 的 升级 ，SQLite 在 功能 和 用 户 数 上 都 得 到 了 
稳步 的 发 展 。 在 2001 年 中 期 ， 很 多 项 目 一 一 开源 的 或 商业 的 一 一 都 开始 使 用 SQLite。 在 那 以 
后 的 几 年 中 ， 开 源 社区 的 其 他 成 员 开 始 为 他 们 喜欢 的 程序 设计 语言 编写 SQLite 扩 展 。SQLite 
的 ODBC 接 口 可 以 为 Perl、Python、Ruby、Java 和 其 它 主流 的 程序 设计 语言 提供 支持 ， 这 证 
明了 SQLite 有 广阔 的 应 用 前 景 。 


2004 年 ，SQLite 从 版 本 2 升级 到 版 本 3， 这 是 一 次 大 升级 。 主 要 目的 是 增加 内 置 的 对 UTF-8、 
UTF-16 及 用 户 定义 字符 集 的 支持 。While 3.0 was originally slated for release in summer 
2005, America Online provided the necessary funding to see that it was completed by July 
2004. 除 国 际 化 功能 外 ， 版 本 3 的 其 它 新 特性 包括 : 经 过 修补 的 C APl， 更 紧凑 的 数据 库 文件 
格式 ( 比 原来 节省 25% 的 空间 )， 弱 类 型 ， 大 二 进 制 对 象 (BLOB) 的 支持 ，64-bit 的 ROWID ， 
autovacuum 和 改进 了 的 并 发 控制 。 尽 管 增加 了 这 一 系列 新 特性 ， 版 本 3 的 运行 库 仍然 小 于 
240K 字 节 。Another improvement in version 3 was a good code cleanup—revisiting and 
rewriting, or otherwise throwing out extraneous stuff accumulated in the 2.x series. 


SQLite 持 续 增长 并 始终 坚持 其 最 初 的 设计 目标 : EDGE S RES RR» IRR e tn RY A o A 
书 出 版 时 ，SQLite 已 经 增加 了 CHECK 约 束 ， 下 面 就 要 增加 外 键 约束 ， 再 下 面 呢 ? 


谁 使 用 SQLite 


当前 ，SQLite 已 经 被 多 种 软件 和 产品 所 使 用 。 它 被 用 在 Apple 的 Mac OS X 操 作 系统 中 ， 被 用 
作 其 CoreData 应 用 程序 架构 的 一 部 分 。 它 还 应 用 于 Safari 的 Web 浏 览 器 、Mail.app 的 电子 邮件 
程序 、RSS 的 管理 、Apple 的 Aperture 照 片 软件 。 


尽管 SQLite 很 少 做 广告 ， 但 它 还 是 被 用 在 了 多 种 消费 类 产品 中 。 


体系 结构 


SQLite 拥 有 一 个 精致 的 、 模 块 化 的 体系 结构 ， 并 引进 了 一 些 独 特 的 方法 进行 关系 型 数据 库 的 
管理 。 它 由 被 组 织 在 3 个 子 系统 中 的 8 个 独立 的 模块 组 成 ， 如 图 1-2 所 示 。 这 个 模型 将 查询 过 程 
划分 为 几 个 不 连续 的 任务 ， 就 像 在 流水 线 上 工作 一 样 。 在 体系 结构 栈 的 顶部 编译 查询 语句 ， 
在 中 部 执行 它 ， 在 底部 处 理 操作 系统 的 存储 和 接口 。 
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Virtual Machine 


图 1-2 SQLite 29 4& A 45 449 


4% u (Interface) 


接口 由 SQLite C API 组 成 ， 也 就 是 说 不 管 是 程序 、 脚 本 语言 还 是 库 文件 ， 最 终 都 是 通过 它 与 
SQLite 交 互 的 (我 们 经 常 使 用 的 ODBC/JDBC 最 后 也 会 转化 为 相应 C API 的 调用 ) 。 


编译 器 (Compiler) 


编译 过 程 从 分 词 器 (Tokenizer) 和 分 析 器 (Parser) 开 始 。 它 们 协作 处 理 文本 形式 的 结构 化 查询 
(Structured Query Language, SQL) 语 如， 分 析 其 语法 有 效 性 ， 转 化 为 底层 能 更 方便 处 理 的 层 
次 数据 结构 语法 树 ， 然 后 把 语法 树 传 给 代码 生成 器 (code generator) 进 行 处 理 。SQLite 分 
词 器 的 代码 是 手工 编写 的 ， 分 析 器 代码 是 由 SQLite 定 制 的 分 析 器 生成 器 ( 称 为 Lemon) 生 成 的 。 
The Lemon parser generator is designed for high performance and takes special 
precautions to guard against memory leaks. 一 旦 SQL 语 和 句 被 分 解 为 囊 值 并 组 织 到 语法 树 中 ， 
分 析 器 就 将 该 树 下 传 给 代码 生成 器 进行 处 理 。 而 代码 生成 器 根据 它 生成 一 种 SQLite 专 用 的 汇 
编 代码 ， 最 后 由 虚拟 机 (Virtual Machine) 执 行 。 





虚拟 机 (Virtual Machine) 


架构 中 最 核心 的 部 分 是 虚拟 机 ， 或 者 叫做 虚拟 数据 库 引 擎 (Virtual DataBase Engine, VDBE) ° 
它 和 Java 虚 拟 机 相似 ， 解 释 执行 字 节 代码 。VDBE 的 字 节 代码 ( 称 为 虚拟 机 语言 ) 由 128 个 操作 
码 (OpCcodes) 构 成 ， 主 要 是 进行 数据 库 操作 。 它 的 每 一 条 指令 或 者 用 来 完成 特定 的 数据 库 操作 
(比如 打开 一 个 表 的 游标 、 开 始 一 个 事务 等 )， 或 者 为 完成 这 些 操作 做 准备 。 总 之 ， 所 有 的 这 些 
指令 都 是 为 了 满足 SQL 命 令 的 要 求 。VDBE 的 指令 集 能 满足 任何 复杂 SQL 命 令 的 要 求 。 所 有 的 





SQLite SQL 4 从 选择 和 修改 记录 到 创建 表 、 视 图 和 索引 一 都 是 首先 编译 成 此 种 虚拟 
机 语言 ， 组 成 一 个 独立 程序 ， 定 义 如 何 完成 给 定 的 命令 。 例 如 ， 在 SQLite 的 CLP 中 执行 下 面 


Tea): 


sqlite> .m col 

sqlite> .h on 

sqlite> .w 4 15 3 3 3 10 3 

sqlite> explain SELECT name FROM episodes LIMIT 10; 
SQLite 会 显示 编译 后 的 VDBE 汇 编程 序 ， 如 列表 1-1 所 示 。 

列表 1-1 VDBE 汇 编程 序 


addr opcode pi p2 p3 p4 p5 comment 
0 Trace 0 0 0 00 
1 Integer 10 1 0 00 
2 MustBeInt 1 0 0 00 
3 IfZero ak 13 0 00 
4 Goto 0 14 0 00 
5 OpenRead 0 2 0 3 00 
6 Rewind 0 12 0 00 
7 Column 0 2 2 00 
8 ResultRow 2 1 0 00 
9 AddImm sl eal 0 00 
10 IfZero 1 12 0 00 
11 Next 0 7 0 01 
12 Close 0 0 0 00 
13 Halt 0 0 0 00 
14 Transaction 0 0 0 00 
15 VerifyCookie 0 40 0 00 
16 TableLock 0 2 0 episodes 00 
17 Goto 0 5 0 00 


程序 由 17 条 指令 组 成 。 通 过 对 给 定 的 操作 数 完成 特别 的 操作 ， 这 些 指令 将 会 返回 episodes 表 
前 10 个 记录 的 name 字 段 的 值 。episodes 表 是 本 书 示例 数据 库 的 一 部 分 。 


从 多 个 方面 都 可 以 看 出 ，VDBE 是 SQLite 的 核心 : 它 上 面 的 各 模块 都 是 用 于 创建 VDBE 程 序 ， 
它 下 面 的 各 模块 都 是 用 于 执行 VDBE 程 序 ， 每 次 执行 一 条 指令 。 


Je 3 (Back-end) 


Ja 3 H B-tree ^ T 4+? (page cache，pager) 和 操作 系统 接口 ( 即 系统 调用 ) 构 成 。B-tree 和 page 
cache 共 同 对 数据 进行 管理 。 它 们 操作 的 是 数据 库 页 ， 这 些 页 具有 相同 的 大 小 ， 就 像 集装箱 。 
页 里 面 的 "货物 "是 表示 信息 的 大 量 bit， 这 些 信 息 包 括 记 录 、 字 段 和 索引 入 口 等 。B-tree 和 
pager 都 不 知道 信息 的 具体 内 容 ， 它 们 只 负责 "运输 ”这 些 页 ， 页 不 关心 这 些 “ 集 装 箱 ”" 里 面 是 什 
Res 


B-tree 的 主要 功能 就 是 索引 ， 它 维护 着 各 个 页 之 间 的 复杂 的 关系 ， 便 于 快速 找到 所 需 数 据 。 它 
把 页 组 织 成 树 型 的 结构 (这 是 它 名 称 的 由 来 )， 这 种 树 是 为 查询 而 高 度 优化 了 的 。Page 为 B-tree 
服务 ， 为 它 提供 页 。Pager 的 主要 作用 就 是 通过 OS 接口 在 B-tree 和 磁盘 之 间 传 递 页 。 磁 盘 操作 
是 计算 机 到 目前 为 止 所 必须 做 的 最 慢 的 事情 。 所 以 ，pager 尽力 提高 速度 ， 其 方法 是 把 经 常 使 
用 的 页 存放 到 内 存 当 中 的 页 缓冲 区 里 ， 从 而 尽量 减少 操作 磁盘 的 次 数 。 它 使 用 特殊 的 算法 来 
预测 下 面 要 使 用 哪些 页 ， 从 而 使 B-tree 能 够 更 快 地 工作 。 


工具 和 测试 代码 (Utilities and Test Code) 


工具 模块 中 包含 各 种 各 样 的 实用 功能 ， 还 有 一 些 如 内 存 分 配 、 字 符 串 比较 、Unicode 转 换 之 类 
的 公共 服务 也 在 工具 模块 中 。 这 个 模块 就 是 一 个 包罗 万 象 的 工具 箱 ， 很 多 其 它 模块 都 需要 调 
用 和 共享 它 。 


测试 模块 中 包含 了 无 数 的 回归 测试 语句 ， 用 来 检查 数据 库 代码 的 每 个 细微 角落 。 这 个 模块 是 
SQLite 性 能 如 此 可 靠 的 原因 之 一 。 


SQLite 的 特色 


尽管 SQLite 是 如 此 之 小 ， 却 提供 了 如 此 之 多 的 特 生 能 。 它 支持 ANSI SQL92 的 一 个 大 子 集 
(包括 事务 、 视 图 、 检 查 约 束 、 关 联 子 查 询 和 复合 查询 等 )， 还 支持 其 它 很 多 关系 型 数据 库 的 特 
色 ， 如 触发 器 、 索 引 、 dM eens teens 名 等 。SQLite 还 有 很 多 独特 的 特色 ， 
如 内 在 数据 库 、 动 态 类 型 和 冲突 解决 (下 面 解释 ) 。 


如 本 章 开 始 时 所 述 ， 在 SQLite 的 观念 和 实现 中 ， 都 遵循 着 一 系列 指导 原则 。 下 面 就 来 详 述 这 
些 原 风 ] o 


4E. 


从 SQLite 的 设计 之 始 ， 就 没准 备 在 应 用 时 使 用 DBA。 配置 和 管理 SQLite 就 像 得 到 它 一 样 简 
单 。SQLite 包 含 了 正好 适合 于 一 个 程序 员 的 脑筋 的 特色 。 


兼容 性 


SQLite 在 设计 时 特别 注意 了 兼容 性 。 它 可 以 编译 运行 在 Windows ` Linux ` BSD ` Mac OS X 
及 商用 的 Unix 系统 如 Solaris、HPUX 和 AIlX， 还 可 以 应 用 于 很 多 嵌入 式 平台 如 QNX、 
VxWorks ` Symbian ` Palm OS 和 Windows CE。 它 可 以 无 缝 地 工作 在 16-bit、32-bit 和 64-bit 
体系 结构 中 并 且 能 同时 适应 字 节 的 大 端 格式 和 小 端 格式 。SQLite 的 兼容 性 并 不 只 表现 在 代码 
上 ， 还 表现 在 其 数据 库 文 件 上 。SQLite 的 数据 库 文 件 在 其 所 支持 的 所 有 操作 系统 、 硬 件 体 系 
结构 和 字 节 顺序 上 都 是 二 进 制 一 致 的 。 你 可 以 在 Sun SPARC 工 作 站 上 创建 一 个 SQLite 数 据 库 
然后 在 Mac aes 的 机 器 上 一 一 其 至 移动 电话 上 一 一 使 用 它 ， 而 不 需要 做 任何 转换 和 修 
改 。 此 外 ，SQLite 数 据 库 可 以 支撑 2TB 的 数据 量 ( 受 操作 系统 限制 )， 还 内 置地 同时 支持 UTF-8 
和 UTF-16 编 码 。 


紧凑 性 


SQLite 的 设计 可 以 说 是 功能 齐全 但 体积 很 小 : 1 个 头 文件 ，1 个 库 ， 不 需要 扩展 的 数据 库 服 
务 。 所 有 的 东西 ， 包 括 客户 端 、 服 务 器 和 虚拟 机 等 ， 都 被 打包 在 1/4 兆 大 小 之 内 。 如 果 在 编译 
时 去 掉 一 些 不 需要 的 特性 ， 程 序 库 可 以 缩小 至 170KB (在 x86 硬 件 平台 上 使 用 GNU Cit tt 
译 )。 此 外 ， 还 有 一 个 SQLite 的 私有 版 本 ， 大 小 是 69KB， 可 以 运行 在 智能 卡 上 ( 参 “ 附 加 信息 "一 


ET 


pe 


空 注 : 我 下 载 的 DLL 有 500 多 KB ° 


简单 


作为 程序 库 ，SQLite 的 API 可 以 算是 最 简单 最 易 用 的 了 。SQLite 既 有 很 好 的 文档 又 很 容易 望 文 


知 意 。 


适应 性 


SQLite 的 几 个 特性 使 其 成 为 一 个 适应 性 极 强 的 数据 库 。 作 为 一 个 内 识 式 的 数据 库 ，SQLite 在 
以 下 两 个 方面 都 做 得 最 好 : 强 有 力 而 可 伸缩 的 关系 型 数据 库 前 端 简单 而 紧凑 的 B-tree 后 端 。 


不 受 拘束 的 授权 


SQLite 的 全 部 代码 都 在 公共 域 中 ， 不 需要 授权 。SQLite 的 任何 一 部 分 都 没有 附加 版 权 要 求 。 
所 有 曾经 为 SQLite 项 目 贡献 过 代码 的 人 都 签署 过 一 个 宣 获 书 将 他 们 的 贡献 发 布 到 公共 域 。 也 
就 是 说 ， 无 论 你 如 何 使 用 SQLite 的 代码 都 不 会 有 法 律 方面 的 限制 。 你 可 以 修改 、 人 合并、 发 
布 、 出 售 或 将 这 些 代码 用 于 任何 目的 ， 商 业 和 中 非 商业 的 ， 不 需要 支付 任何 费用 ， 不 会 受到 
任何 限制 。 


可 村 性 


SQLite 的 源 代码 不 但 免费 ， 还 编写 得 很 好 。SQLite 源 代码 包含 大 约 30000 行 标准 C 代 码 ， 它 是 
干净 的 、 模 块 化 的 和 完好 注释 的 。SQLite 源 代码 易 理 解 、 多 定制 。 


SQLite 的 核心 软件 ( 库 和 工具 ) 由 约 30000 行 代码 组 成 ， 但 分 发 的 程序 中 还 包含 有 超过 30000 行 
的 回归 测试 代码 ， 它 们 覆盖 了 97% 的 核心 代码 。 也 就 是 说 ， 超 过 一 半 的 SQLite 项 目 代 码 是 专 
门 用 于 回归 测试 的 ， 也 就 是 说 ， 差 不 多 每 写 一 行 功能 代码 ， 都 要 写 一 行 测试 代码 对 它 进 行 测 
试 。 


aun 提供 一 些 独特 的 功能 来 提高 易 用 性 ， 包 括 动态 类 型 、 冲 突 解决 和 "附加 ”多 个 数据 库 到 
连接 的 能 力 。 


能 和 限制 


SQLite 是 一 个 快速 数据 库 。 但 “快速 "这 个 词 本 身 是 一 个 主观 的 和 不 明确 的 词 。 诚 实地 讲 ， 有 些 
事情 SQLite 能 比 其 它 数据 库 做 得 快 ， 也 有 些 事情 不 能 。 这 么 说 吧 ， 利 用 SQLite 提 供 的 配置 参 
数 ，SQLite 是 足够 快速 和 高 效 的 。 跟 大 多 数 其 它 数据 库 一 样 ，SQLite 使 用 B-tree 处 理 索引 ， 使 
用 B+tree 处 理 表 数 据 。 因 此 ， 在 对 单 表 进行 查询 时 ，SQLite 要 快 于 (或 至 少 相 当 于 ) 其 它 数据 库 
的 速度 。 


在 一 些 情况 下 SQLite 可 能 不 如 大 型 数据 库 快 ， 但 大 多 数 这 些 情 况 是 可 理解 的 。SQLite 是 一 个 
内 花 式 的 数据 库 ， 设 计 用 于 中 小 规模 的 应 用 程序 。 这 些 限制 是 符合 设计 目的 的 。 很 多 新 用 户 
蕴 误 地 假设 使 用 SQLite 可 以 代替 大 型 关系 型 数据 库 ， 这 有 时 行 ， 但 有 时 不 行 ， 依 赖 于 你 准备 
用 SQLite 来 做 什么 。 一 般 情况 下 ，SQLite 在 三 个 主要 的 方面 具有 局 限 性 


e 并 发 。 
e 数据 库 大 小 。 
e 网 络 。 

尽管 SQLite 做 得 已 经 很 好 了 ， 但 仍 有 部 分 特性 未 能 实现 ， 包 括 : 
e 外 键 约束 空 注 : SQLite 的 最 新 版 本 3.6.19 好 像 已 经 支持 了 。 
e 完整 的 触发 器 支持 。 
e 完整 的 ALTER TABLE 支 持 。 
。 FFRAE? 
。 RIGHT 和 FULL OUTER JOIN 。 
e 可 修改 视图 。 


e GRANT 和 REVOKE 。 


SQLite 网 站 有 丰富 的 信息 ， 包 括 官方 文档 、 邮 件 列表 、Wiki 和 其 它 的 一 般 信 息 ， 它 的 网 址 是 
www.sqlite.org。SQLite 社 区 也 是 很 有 帮助 的 ， 你 可 能 从 邮件 列表 中 找到 任何 你 所 需要 的 东 
西 。 另 外 ， "anion us uedEter oe nO EU MA 

台 ) 和 增强 的 SQLite 版 本 ， 这 些 版 本 包括 内 置 了 加 密 功 能 的 版 本 和 为 姐 入 式 应 用 优化 的 极 小 化 
版 本 。 更 多 的 信息 可 以 从 www.hwaci.com/sw/sqlite/prosupport.html 中 找到 。 
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无 论 您 使 用 何 种 操作 系统 ，SQLite 都 很 容易 上 手 。 对 大 多 数 用 户 ， 安 装 SQLite 并 创建 一 个 新 
的 数据 库 不 会 超过 5 分 钟 ， 且 不 需要 任何 经 验 。 

空 注 : 本 章 我 只 看 了 Windows 操 作 系 统 下 使 用 VC 的 内 容 。 


从 哪 得 到 SQLite 
SQLite 网 站 (www.sqlite.org) 同 时 提供 SQLite 的 已 编译 版 本 和 源 程序 。 编 译 版 本 可 同时 适用 于 
Windows 和 Linux ° 
有 几 种 形式 的 二 进 制 包 供 选择 ， 以 适应 SQLite 的 不 同 使 用 方式 。 包 括 : 
静态 链接 的 命令 行程 序 (CLP) 
e SQLite 动 态 链接 库 (DLL) 
。 Tcl 扩 展 


SQLite 源 代码 以 两 种 形式 提供 ， 以 适应 不 同 的 平台 。 pU 了 在 Windows 下 编译 ， 另 一 种 为 
了 在 POSIX 平 台 (如 Linux, BSD, and Solaris) 下 编译 ， 这 两 种 形式 下 源 代 码 本 身 是 没有 差别 
的 。 


在 Windows 上 使 用 SQLite 
无 论 你 是 作为 终端 用 户 还 是 作为 程序 员 来 使 用 SQLite > de 易 地 安装 在 


Windows 环 境 下 。 本 节 我 们 将 讨论 所 有 相关 的 内 容 一 一 安装 二 进 制 包 或 在 最 普通 的 编译 环境 
下 使 用 源 代码 。 


获得 命令 行程 序 

SQLite 命 令 行 程序 (CLP) 是 开始 使 用 SQLite 的 一 个 比较 好 的 选择 。 
略 ， 参 原文 。 

获得 SQLite 的 动态 链接 库 (DLL) 


SQLite 的 DLL 文件 供 编译 好 的 程序 动态 连接 SQLite。 大 多 数 使 用 SQLite 的 软件 都 会 拥有 自己 
的 SQLite DLL 拷贝 并 随 软 件 自动 安装 。 


££ Windows 343% T /& i£ SQLite 7$ 1.3 


在 Windows 环 境 下 编译 SQLite 源 代码 是 很 简单 的 。 根 据 你 所 使 用 的 编译 器 和 你 要 做 什么 ， 有 

a 。 最 常见 的 环境 是 Microsoft Visual C++ 或 MinGW， 本 节 都 会 加 以 介 
。 关 于 使 用 其 它 编译 器 编译 SQLite 的 内 容 ， 可 参考 SQLite Wiki 

oan et ek CHOW TG COROSTS 


Jf] Microsoft Visual C++ 构建 SQLite DLL 


WUE PR > D$ A RARA > Visual C++ 上 构建 SQLite DLL : 

1. Æ 3) Visual Studio。 在 解 包 的 SQLite 源 程序 目录 中 创建 一 个 新 的 DLL“ 空 项目。 
高 : 不 同 版 本 操作 略 有 不 同 ， 不 详细 解释 了 。 

2. 将 全 部 SQLite 源 文件 加 入 到 项 目 中 来 。 包 括 所 有 的 .c 文 件 和 .h 文 件 。 除 了 
shell.c : 该 文件 包括 main() 函 数 ， 用 于 创建 CLP 可 执行 程序 。 
tclsglite.c : 该 文件 用 于 TCL 支 持 。 


空 注 : 我 使 用 的 版 本 (sqlite-source-3 6_ 18.zip) 有 些 函 数 有 重复 定义 ， 还 得 去 掉 两 个 文件 ， 不 
知 会 引起 什么 后 果 ， 它 们 是 fts3.c 和 fts3_tokenizer.c。 


3. 执行 构建 (Build) 命 令 ，OK。 


还 可 以 选择 构建 线程 完全 的 DLL 或 发 布 (Release) 版 的 DLL， 参 原文 。 


Jf] Microsoft Visual C++ 构建 SQLite CLP 


方法 基本 同上 。 


创建 项 目 时 选择 Win32 Console Application， 添 加 文件 时 把 shell.c 也 加 上 ， 即 可 。 


使 用 SQLite 数 据 库 


SQLite 的 CLP 是 使 用 和 管理 SQLite 数 据 库 最 常用 的 方法 。 


它 可 运行 于 多 种 平台 ， 学 会 使 用 CLP， 可 以 保证 你 永远 有 一 个 通用 和 熟悉 的 途径 来 管理 你 的 
数据 库 。CLP 其 实 是 两 个 程序 。 它 可 以 运行 在 命令 行 模式 下 完成 各 种 数据 库 管理 任务 ， 也 可 
以 运行 在 Shell 模 式 下 ， 以 交互 的 方式 执行 查询 操作 。 


Shell 模 式 下 使 用 CLP 


运行 DOS shell， 进 入 工作 目录 ， 在 命令 行 上 键入 sqlite3 命 令 ， 命 令 后 跟随 一 个 可 选 的 数据 库 
文件 名 。 如 果 在 命令 行 上 不 指定 数据 库 名 ，SQLite 将 会 使 用 一 个 内 存 数据 库 ， 其 内 容 在 退出 
CLP 时 将 会 丢失 。 
CLP 以 交互 形式 运行 ， 你 可 以 在 其 上 执行 查询 、 获 得 Schema 人 信息、 导入 /导出 数据 和 执行 其 它 
各 种 各 样 的 数据 库 任务 。CLP 认 为 你 输入 的 任何 语句 都 是 一 个 查询 命令 (query)， 除 非 命令 是 
以 点 (.) 开 始 ， 这 些 命令 用 于 特殊 操作 。 键 入 .help 或 .h 可 以 得 到 这 些 操作 的 完整 列表 。 键 入 .exit 
或 .6 退出 CLP。 
让 我 们 从 创建 一 个 称 为 test.db 的 数据 库 开 始 。 在 DOS shell 下 键入 : 
sqlite3 test.db 
ACE AUI DET BEES > Jede GR AGE ES 4E > SQLiteH# FA & Ee E © 
SQLite FF A 3E M 66] E. PH Zo 1 RE 4 78 4 ep EDO Ode dE Ep ORT A SUL 
图 。 这 样 做 的 原因 是 给 你 机 会 在 将 数据 库 写 到 外 部 文件 之 前 对 数据 库 做 一 些 永 久 性 的 设置 ， 
如 页 的 大 小 等 。 有 些 设置 ， 如 页 大 小 、 字 符 集 (UTF-8 或 UTF-16) 等 ， 一 旦 数据 库 创建 之 后 就 不 
能 再 修改 了 。 这 个 中 间 期 是 你 能 改 它们 的 唯一 机 会 。 我 们 采用 默认 设置 ， 因 此 ， 要 将 数据 库 
写 到 磁盘 ， 我 们 仅 需 要 在 其 中 创建 一 个 表 。 输 入 如 下 语句 : 
sqlite> create table test (id integer primary key, value text); 
现在 你 有 了 一 个 称 为 test.db 的 数据 库 文件 ， 其 中 包含 一 个 表 test， 该 表 包 含 两 个 字段 。 

e 一 个 称 为 id 的 主键 字段 , 它 带 有 自动 增长 属性 。 无 论 何 时 你 定义 一 个 整 型 主键 字段 ， 

SQLite 都 会 对 该 字段 应 用 自动 增长 属性 。 
e. 一 个 简单 的 称 为 value 的 文本 字段 。 


向 表 中 插入 几 行 数据 : 


sqlite> insert into test (value) values('eenie'); 
sqlite> insert into test (value) values('meenie'); 
sqlite> insert into test (value) values('miny'); 
sqlite> insert into test (value) values('mo'); 


将 插入 的 数据 取 回 : 


sqlite> .mode col 
sqlite> .headers on 
sqlite> SELECT * FROM test; 


系统 显示 : 


id value 
1 eenie 
2 meenie 
3 miny 

4 mo 


SELECT 4] 3j 4 A 4-47 4(.headers and .mode) 用 于 改进 输出 的 格式 。 可 以 看 到 SQLite 为 id 
字段 赋予 了 连接 的 整数 值 ， 而 这 些 值 我 们 在 INSERT 语 名 中 并 没 的 提供 。 对 于 自动 增长 的 字 
段 ， 你 可 能 会 关心 最 后 插入 的 一 条 记录 该 字段 的 取 值 ， 此 值 可 以 用 SQL 函数 

last insert rowid()41 5] » 


sqlite> select last insert rowid(); 
last insert rowid() 
4 


在 退出 CLP 之 前 ， 让 我 们 来 为 数据 库 创建 一 个 索引 和 一 个 视图 ， 后 面 的 内 容 中 将 会 用 到 它 
们 。 


sqlite> create index test_idx on test (value); 
sqlite> create view schema as select * from sqlite master; 


使 用 .exit 命 令 退 出 CLP。 


sqlite> .exit 
Cc:\Temp> 


获得 数据 库 的 Schema 信息 


> 


~ 


有 几 个 shell 命 令 用 于 获得 有 关 数 据 库 内 容 的 信息 。 你 可 以 键入 命令 .tables [pattern] 来 得 到 所 
有 表 和 视图 的 列表 ， 其 中 [pattern] 可 以 是 任何 类 SQL 的 操作 符 。 执 行 上 述 命令 会 返回 符合 条 件 
的 所 有 表 和 视图 ， 如 果 没 有 pattern 项 ， 返 回 所 有 表 和 视图 。 


sqlite> .tables 
schema test 


可 以 看 到 我 们 创建 的 表 test 和 视图 Schema。 同 样 的 ， 要 显示 一 个 表 的 索引 ， 可 以 键入 命 
4- indices [table name] : 


sqlite> .indices test 
test_idx 


可 以 看 到 我 们 为 表 test 所 创建 的 名 为 test_idx 的 索引 。 使 用 .schema [table name] 可 以 得 到 一 个 
表 或 视图 的 定义 (DDL) 语 句 。 如 果 没 提供 表 名 ， 则 返回 所 有 数据 库 对 象 (包括 table、indexe、 
view 和 index) 的 定义 语句 : 


sqlite> .schema test 
CREATE TABLE test (id integer primary key, value text); 
CREATE INDEX test_idx on test (value); 


sqlite> .schema 


CREATE TABLE test (id integer primary key, value text); 
CREATE VIEW schema as select * from sqlite_master; 
CREATE INDEX test_idx on test (value); 


更 详细 的 Schema 信息 可 以 通过 SQLite 唯 一 的 一 个 系统 视图 sqlite_master 得 到 。 这 个 视图 是 一 
个 系统 目录 ， 它 的 结构 如 表 2-1 所 示 。 


表 2-1 sqlite_master 表 结构 


编 
wa 


号 
1 
2 


4 


5 


字段 


type 


name 


tbl_name 


rootpage 


SQL 


说 明 


值 为 "table"、 "index" ^ "trigger" 或 "View" 之 一 。 
对 象 名 称 ， 值 为 字符 串 。 


如 果 是 表 或 视图 对 象 ， 此 字段 值 与 字段 2 相同 。 如 果 是 索引 或 触发 器 对 
象 ， 此 字段 值 为 与 其 相关 的 表 名 。 


对 触发 器 或 视图 对 象 ， 此 字段 值 为 0。 对 表 或 索引 对 象 ， 此 字段 值 为 其 
根 页 的 编号 。 


字符 串 ， 创 建 此 对 象 时 所 使 用 的 SQL 语句 o 


查询 当前 数据 库 的 sqlite_master 表 ， 返 回 : 


sqlite> .mode col 


sqlite> .headers on 
sqlite> select type, name, tbl_name, sql from sqlite_master order by type; 


type 
index 
table 
view 


name 


test_idx 


test 
schema 


tbl name sql 


test CREATE INDEX test_idx on test (value) 
test CREATE TABLE test (id integer primary 
schema CREATE VIEW schema as select * from s 


uTip : 使 用 向 上 的 箭头 键 可 以 回 滚 到 前 面 输入 过 的 命令 。 


数据 导出 


可 以 使 用 .dump 命 令 将 数据 库 导 出 为 SQL 格式 的 文件 。 不 使 用 任何 参数 ，.dump 将 导出 整个 数 
据 库 。 如 果 提 供 参 数 ，CLP 把 参数 理解 为 表 名 或 视图 名 。 


sqlite> ,Output file.sql 
sqlite> .dump 
sqlite> .output stdout 


数据 导入 


有 两 种 方法 可 以 导入 数据 ， 用 哪 种 方法 决定 于 要 导入 的 文件 的 格式 。 如 果 文 件 由 SQL 语 句 构 
成 ， 可 以 使 用 .read 命 令 导 入 (执行 ) 文 件 。 如果 文 件 是 由 过 号 或 其 它 定 界 符 分 隔 的 值 (Comma- 
separated values, CSV) 组 成 ， 可 使 用 .import [file][table] 命 令 。 此 命令 将 解析 指定 的 文件 并 学 
试 将 数据 插入 到 指定 的 表 中 。 


sqlite> .show 
echo: off 
explain: off 
headers: on 
mode: column 
nullvalue: "" 
output: stdout 
separator: "|" 
width: 


.read 命 令 用 来 导入 由 .dump 命 令 创 建 的 文件 。 如 果 要 使 用 前 面 作为 备份 文件 所 导出 的 file.sql ， 
需要 先 移 除 已 经 存在 的 数据 库 对 象 (test 表 和 schema 视 图 )， 然 后 用 下 面 方法 导入 : 


sqlite> drop table test; 
sqlite> drop view schema; 
sqlite> ,read file.sql 


格式 化 


CLP 提 供 了 几 个 格式 化 选项 命令 。 最 简单 的 是 .echo, 如 果 设 置 .echo on， 则 新 输入 的 命令 在 执 
行 前 都 会 回 显 ， 默 认 值 是 off。.headers 设 置 为 on 时 ， 查 询 结果 显示 时 带 有 字段 名 。 当 遇 到 
NULL 值 时 ， 如 果 需 要 以 一 个 字符 串 来 显示 ， 使 用 .nullvalue 命 令 设置 ， 如 : 


sqlite> .nullvalue NULL 


默认 情况 下 使 用 空 事 。 如 果 要 改变 CLP 的 shell 提 示 符 ， 使 用 .prompt [value] > 4 : 


sqlite> .prompt 'sqlite3> ' 
sqlite3> 


.mode 命 令 可 以 设置 结果 数据 的 几 种 输出 格式 。 可 选 的 格式 为 csv、column、html、insert、 
line list、tabs 和 tcl。 默 认 值 是 list， 在 此 模式 下 显示 结果 时 列 间 以 默认 的 分 隔 符 分 隔 。 如 果 你 
想 以 CSV 格 式 输 出 一 个 表 的 数据 ， 可 如 下 操作 : 

sqlite3> .output file.csv 

sqlite3> .separator , 


sqlite3> select * from test; 
sqlite3> .output stdout 


x ffile.csv 4g ABA : 


eenie 
meenie 
miny 
mo 


天 ODP 
Se Sees 


因为 有 一 个 CSV 模 式 ， 所 以 下 面 的 命令 会 得 到 相似 的 结果 : 


sqlite3> .output file.csv 
sqlite3> .mode csv 

sqlite3> select * from test; 
sqlite3> .output stdout 


i) 


在 命令 行 方式 下 执行 CLP 


在 DOS 或 UNIX 的 命令 行 方式 下 ， 直 接 执行 SQLite 的 数据 库 操作 o 


数据 库 管理 


所 有 的 数据 库 管 理 任 务 都 可 以 在 shell 和 命令 行 模式 下 完成 


创建 、 备 份 和 删除 数据 库 


数据 库 的 备份 有 两 种 方法 。 第 1 种 是 使 用 .dump， 可 得 到 SQL 格式 的 文件 。 在 命令 行 方式 下 可 
如 下 做 : 


sqlite3 test.db .dump > test.sql 


在 CLP 中 可 如 下 做 : 


sqlite> ,Output file.sql 
sqlite> .dump 
sqlite> .exit 


相应 地 ， 寻 入 一 个 SQL 格式 备份 的 数据 库 可 如 下 做 : 


sqlite3 test.db < test.sql 


此 处 假设 test.db 不 存在 。 如 果 它 存在 ， 则 或 许 会 因为 数据 库 中 有 同名 的 对 象 而 出 错 。 

可 以 用 复制 的 方法 得 到 一 个 二 进 制 的 数据 库 文件 拷贝 。 但 也 许 在 复制 之 前 你 想 先 抽空 
(vacuum) 它 ， 也 就 是 释放 数据 库 文件 中 未 使 用 的 空间 ， 以 得 到 一 个 更 小 的 数据 库 文件 。 可 操 
作 如 下 : 


sqlite3 test.db VACUUM 
cp test.db test.backup 


一 般 情 况 下 ， 二 进 制 的 备份 如 不 SQL 备份 兼容 性 好 。 尽 管 SQLite 有 很 好 的 向 上 兼容 性 和 各 操 
作 系 统 间 文件 格式 的 一 致 性 ， 但 如 果 想 要 将 备份 文件 保留 很 长 时 间 ， 还 是 SQL 格式 保险 一 
些 。 


当 一 个 数据 库 你 不 想 再 用 时 ， 简 单 地 从 操作 系统 中 将 其 文件 删除 就 行 了 。 


a+ 2 BA = ^ M 

获得 数据 库 文 件 的 信息 

按 前 文 所 述 ， 获 得 数据 库 信息 的 主要 途径 是 使 用 sqlite_master 视 图 ， 它 提供 一 个 数据 库 所 包 
含 的 所 有 对 象 的 细节 信息 。 


如 果 你 想 获 得 关于 物理 的 数据 库 结构 信息 ， 可 以 使 用 一 个 称 为 SQLite Analyzer 的 工具 ， 它 可 
以 在 SQLite 网 站 上 下 载 得 到 。SQLite Analyzer 可 以 提供 磁盘 SQLite 数 据 库 的 详细 技术 信息 。 


(输出 结果 略 ) 
其 它 SQLite 工 具 


有 很 多 其 它 开源 的 或 商业 的 程序 可 工作 于 SQLite， 其 中 具有 优秀 图 形 化 界面 且 跨 平台 的 有 : 
e SQLite Database Browser (http://sqlitebrowser.sourceforge.net) 
e SQLite Control Center (http://oobmanc.home.comcast.net/sqlitecc.html) 


e SQLiteManager (www.sqlabs.net/sqlitemanager.php) 


PIT 关系 模型 


SQL 具有 非常 实用 的 外 观 和 非常 理论 化 的 内 涵 5， 这 个 内 涵 就 是 关系 模型 。 关 系 模型 时 于 SQL 
出 现 并 对 SQL 的 出 现 提 出 了 需求 。SQL 的 原动力 不 在 语言 本 身 ， 而 是 深 藏 在 关系 模型 的 概念 
当中 。 这 些 概念 构成 了 SQL 设计 和 操作 的 基础 。 


空 注 : 数据 库 基本 理论 ， 参 考 其 它 书 吧 。 


$43: SQL 


本 章 介绍 SQL 的 基本 内 容 和 SQLite 的 特殊 实现 。 本 章 内 容 的 编排 假设 你 没有 SQL 和 关系 模型 
的 基础 知识 。 如 果 你 是 SQL 新 手 ，SQLite 将 带 你 进入 关系 模型 的 精彩 世界 。 


空 注 : 使 用 过 很 多 种 数据 库 ， 所 以 本 章 只 关注 SQLite 与 其 它 DBMS 不 同 的 地 方 ， 如 弱 类 型 什 
么 的 。 


关系 模型 


如 第 3 章 所 述 ，SQL 是 关系 模型 的 产物 ， 关 系 模型 是 由 E. F. Codd 在 1969 年 提出 的 。 关 系 模型 
要 求 关系 型 数据 库 能 够 提供 一 种 查询 语言 ， 几 年 后 ，SQL 应 运 而 生 。 


关系 模型 由 三 部 分 构成 : 表单 (form)、 功 能 (function) 和 一 致 性 (consistency)。 表 单 表 示 信 息 的 
结构 。 在 关系 模型 中 只 使 用 一 种 单独 的 数据 结构 来 表达 所 有 信息 ， 这 种 结构 称 为 关系 
(relation， 在 SQL 中 被 称 为 表 、table)。 关 系 由 多 个 元 组 (tuples， 在 SQL 中 被 称 为 行 、 记 录 、 
rows) 构 成 ， 每 个 元 组 又 由 多 个 属性 (attributes， 在 SQL 中 被 称 为 列 、 字 段 、columns) 构 成 。 


查询 语言 将 外 部 世界 和 数据 的 逻辑 表现 联系 在 一 起 ， 并 使 它们 能 够 交互 。 它 提供 了 取 数 据 和 
修改 数据 的 途径 ， 是 关系 模型 的 动态 部 分 。 


SQL 的 发 展 


第 一 个 被 采用 的 此 类 查询 语言 可 能 是 在 IBM 的 System Rž + » System R 是 一 个 关系 型 数据 库 
的 研究 项 目 ， 此 项 目 直接 派生 出 了 Codd 的 论文 。 这 个 语言 开始 时 被 称 作 SEQUEL ， 

是 “Structured English Query Language” 的 缩写 。 后 来 被 缩短 为 SQL， 或 “Structured Query 
Language” ° 


示例 数据 库 


示例 数据 库 在 本 章 和 后 面 的 章节 中 将 会 用 到 ， 其 中 存储 了 Seinfeld 所 有 episode( 约 180 个 ) 的 食 
品 ( 约 412 种 ) 。 数据库 中 的 表 如 图 4-1 所 示 。 





图 4-1 Seinfeld A = 3t 4E È 


数据 库 的 Schema 定义 如 下 : 


create table episodes ( 
id integer primary key, 
season int, 
name text ); 

create table foods( 
id integer primary key, 
type_id integer, 
name text ); 

create table food_types( 
id integer primary key, 
name text ); 
create table foods_episodes( 
food_id integer, 
episode_id integer ); 


主 表 是 foods。foods 中 的 每 条 记录 代表 一 种 食品 ， 其 名 称 存 储 于 name 字 段 。type_id 参 昭 
food types，food types 表 存储 了 食品 的 分 类 (如 烘 烧 食品 、 饮 品 、 垃 圾 食品 等 ) 。 
foods_episodes 表 是 foods 和 episodes 的 关联 表 。 


建立 


示例 数据 库 文 件 可 在 随 书 的 zip 文 件 中 找到 。 


运行 示例 
为 了 您 的 方便 ， 本 章 的 所 有 SQL 示例 都 保存 在 随 书 zip 文 件 根 目 录 的 sql.sql 文 件 中 。 


对 于 长 SQL 语句 ， 一 个 方便 的 执行 方法 是 将 其 复制 到 一 个 单独 的 文本 文件 ， 如 test.sql 中 ， 然 
后 执行 : 


sqlite3 foods.db < test.sql 


为 了 增加 输出 的 易 读 性 ， 你 应 用 把 下 面 内 容 包含 在 文件 中 : 


.echo on 

.mode col 
.headers on 
.nullvalue NULL 


语法 
SQL 的 语法 很 像 自然 语言 。 每 个 语句 都 是 一 个 祈 使 名， 以 动词 开头 ， 表 示 所 要 做 的 动作 。 后 
面 跟 的 是 主题 和 谓词 ， 如 图 4-2 所 示 。 


select id from foods where namez- 'JujyFruit'; 
SS —— Rt | 


verb subject predicate 

图 4-2 一 般 的 SQL 语法 结构 

AZ 

er 

SQL 由 命令 组 成 ， 每 个 命令 以 分 号 (;) 结 束 。 如 下 面 是 3 个 独立 的 命令 : 


SELECT id, name FROM foods; 
INSERT INTO foods VALUES (NULL, 'Whataburger'); 
DELETE FROM foods WHERE id=413; 


> a 
mu 


也 称 为 Literals ， 表 示 确 切 的 值 ， 有 3 种 : 字符 串 常 量 、 数 据 党 
如 : 


39 
pelo 
D 
E 
应 
3 
ai 
pelo 
4 
E: 

de 
E 
pelo 


'Jerry' 
' Newman ' 
'JujyFruit' 


字符 串 值 用 单 引 号 () 括 起 来 ， 如 果 字 符 串 中 本 身 包 含 单 引号 ， 需 要 双 写 。 如 “Kenny's 
chicken" € X 5 x, : 


'Kenny''s chicken' 
数字 常量 有 整数 、 十 进 制 数 和 科学 记 数 法 表示 的 数 ， 如 : 


eal 
3.142 
6.0221415E23 


二 进 制 值 用 如 Xx'0000' 的 表示 法 ， 其 中 每 个 数据 是 一 个 16 进 制 数 。 二 进 制 值 必须 由 两 个 两 个 的 
16 进 制 数 (8 bits) 组 成 ， 如 : 


x'01' 
x'offf' 
x'OFOEFF' 
X'OfOeffab' 


> PESE 

保留 字 和 标识 符 

保留 字 由 SQL 保留 用 做 特殊 的 用 途 ， 如 SELECT ^ UPDATE ` INSERT ` CREATE 、DROP 和 
BEGIN 等 。 标 识 符 指明 数据 库 里 的 具体 对 象 ， 如 表 或 索引 。 保 留 字 预 定义 ， 不 能 用 做 标识 
符 。SQL 不 区 分 大 小 号， 下面 是 相同 的 语句 : 


SELECT * from foo; 
SeLeCt * FrOm FOO; 


为 清楚 起 见 ， 本 章 中 保留 字 都 用 大 写 ， 标 识 符 都 用 小 写 。 


但 是 ，SQLite 对 字符 串 的 值 是 大 小 写 敏 感 的 。 
注释 
SQL 中 单行 注释 用 双 减 号 开始 ， 多 行 注释 采用 C 风 格 的 / /形式 。 


创建 一 个 数据 库 


数据 库 中 所 有 的 工作 都 围绕 表 进 行 。 表 由 行 和 列 组 成 ， 看 起 来 简单 ， 但 其 实 并 非 如 此 。 表 跟 
其 它 所 有 的 概念 有 关 ， 涉 及 本 章 的 大 部 分 篇 幅 。 在 此 我 们 用 2 分 钟 的 时 间 给 出 一 个 预览 。 


创建 表 


在 SQL 中 ， 创 建 和 删除 数据 库 对 象 的 语句 一 般 被 称 为 数据 定义 语言 (data definition 
language ，DDL)， 操 作 这 些 对 象 中 数据 的 语句 称 为 数据 操作 语言 (data manipulation 
language，DML)。 创 建 表 的 语句 属于 DDL， 用 CREATE TABLE 命 令 ， 如 下 定义 : 


CREATE [TEMP] TABLE table_name (column_definitions [, constraints]); 
用 TEMP 或 TEMPORARY 保 留 字 声 明 的 表 为 临时 表 ， 只 存活 于 当前 会 话 ， 一 旦 连接 断 开 ， 就 
会 被 自动 删除 。 
中 括号 表示 可 选项 。 


另外 ， 坚 线 表示 在 多 个 中 选 一 ， 如 : 


CREATE [TEMP|TEMPORARY] TABLE ... ; 


如 果 没 有 指明 创建 临时 表 ， 则 创建 的 是 基本 表 ， 将 会 在 数据 库 中 持久 存在 。 
数据 库 中 还 有 其 它 类 型 的 表 ， 如 系统 表 和 视图 ， 现 在 先 不 介绍 。 


CREATE TABLE 命 令 至 少 需要 一 个 表 名 和 一 个 字段 名 。 命 令 中 table_name 表 示 表 名 ， 必 须 与 
其 它 所 有 的 标识 符 不 同 。column_definitions 表 示 一 个 用 各 号 分 隔 的 字段 列表 。 每 个 字段 定义 
包括 一 个 名 称 、 一 个 域 和 一 个 逗号 分 隔 的 字段 约束 表 。“ 域 一般 情况 下 是 一 个 类 型 ， 与 编程 语 
言 中 的 数据 类 型 同名 ， 指 明 存 储 在 该 列 的 数据 的 类 型 。 在 SQLite 中 有 5 种 本 地 类 型 : 
INTEGER、REAL、TEXT、BLOB 和 NULL， 所 有 这 些 域 将 在 本 章 后 面 的 “存储 类 ”一 节 中 介 
绍 。“ 约 束 ” 用 来 控制 什么 样 的 值 可 以 存储 在 表 中 或 特定 的 字段 中 。 例 如 ， 你 可 以 用 UNIQUE 约 
束 来 规定 所 有 记录 中 某 个 字段 的 值 要 各 不 相同 。 约 束 将 会 在 “数据 完整 性 "一 节 中 介绍 。 


在 字段 列表 后 面 ， 可 以 跟随 一 个 附加 的 字段 约束 ， 如 下 例 : 


CREATE TABLE contacts ( id INTEGER PRIMARY KEY, 
name TEXT NOT NULL COLLATE NOCASE, 
phone TEXT NOT NULL DEFAULT 'UNKNOWN', 
UNIQUE (name,phone) ); 


改变 表 


你 可 以 用 ALTER TABLE 命 令 改 变 表 的 结构 。SQLite 版 的 ALTER TABLE 命 令 既 可 以 改变 表 
名 ， 也 可 以 增加 字段 。 一 般 格式 为 : 


ALTER TABLE table { RENAME TO name | ADD COLUMN column_def } 


注意 这 里 又 出 现 了 新 的 符号 人 }。 花 括号 括 起 来 一 个 选项 列表 ， 必 须 从 各 选项 中 选择 一 个 。 此 
处 ， 我 们 或 者 ALTER TABLE table RENAME...， 或 者 ALTERTABLE table ADD 

COLUMN... ° That is, you can either rename the table using the RENAME clause, or add a 
column with the ADDCOLUMN clause. To rename a table, you simply provide the new name 
given by name. If you add a column, the column definition, denoted by column_def, follows 
the form in the CREATE TABLE statement. It is a name, followed by an optional domain and 
list of constraints. 例如 : 


sqlite> ALTER TABLE contacts 

ADD COLUMN email TEXT NOT NULL DEFAULT '' COLLATE NOCASE; 
sqlite> .schema contacts 

CREATE TABLE contacts ( id INTEGER PRIMARY KEY, 

name TEXT NOT NULL COLLATE NOCASE, 

phone TEXT NOT NULL DEFAULT 'UNKNOWN', 

email TEXT NOT NULL DEFAULT '' COLLATE NOCASE, 

UNIQUE (name,phone) ); 


显示 了 当前 的 表 定义 。 


表 还 可 以 由 SELECT 语 多 创建， 你 可 以 在 创建 表 结构 的 同时 创建 数据 。 这 种 特别 的 CREATE 
TABLE 语 多 将 在 “插入 记录 "一 节 中 介绍 。 


在 数据 库 中 查询 


SELECT 是 SQL 命令 中 最 大 最 复杂 的 命令 。SELECT 的 很 多 操作 都 来 源 于 关系 代数 。 


关系 操作 


SELECT 中 使 用 3 大 类 13 种 关系 操作 : 
。 基本 的 操作 
o Restriction( 限 制 ) 
o Projection 
o Cartesian Product( 笛 卡尔 积 ) 
o Union( 联 合 ) 


xz 


Difference( E) 


o 


o Rename( 重 命名 ) 
e 附加 的 操作 
o Intersection( 交 又 ) 
o Natural Join( 自 然 连接 ) 
o Assign( 指 派 OR 赋值 ) 
o 扩展 的 操作 
o Generalized Projection 
o Left Outer Join 
o Right Outer Join 
o Full Outer Join 


基本 的 关系 操作 ， 除 重 命名 外 ， 在 集合 论 中 都 有 相应 的 理论 基础 。 附 加 操作 是 为 了 方便 ， 它 
们 可 以 用 基本 操作 来 完成 ， 一 般 情况 下 ， 附 加 操作 可 以 作为 常用 基本 操作 序列 的 快捷 方式 。 
扩展 操作 为 基本 操作 和 附加 操作 增加 特性 。 


ANSI SQL 的 SELECT 可 以 完成 上 述 所 有 的 关系 操作 。 这 些 操作 覆盖 了 Codd 最 初 定义 的 所 有 关 
系 运算 符 ， 只 有 一 个 例外 一 一 divide。SQLite 支 持 ANSI SQL 中 除 right 和 full outer join 之 外 的 所 
有 操作 (这 些 操作 可 用 其 它 间接 的 方法 完成 ) 


操作 管道 
从 语法 上 来 说 ，SELECT 命 令 用 一 系列 子 句 将 很 多 关系 操作 组 合 在 一 起 。 每 个 子 句 代表 一 种 特 
定 的 关系 操作 。 几 乎 所 有 这 些 子 句 都 是 可 选 的 ， 你 可 以 只 选 你 所 需要 的 操作 。 


SELECT 是 一 个 很 大 的 命令 。 下 面 是 SELECT 的 一 个 简单 形式 : 


SELECT DISTINCT heading FROM tables WHERE predicate 
GROUP BY columns HAVING predicate 
ORDER BY columns LIMIT count, offset; 


44% @ £ ——DISTINCT ` FROM ` WHERE4# HAVING——4f & — A4 4k 89 -F 4) o ENF 
名 由 保留 字 和 跟随 的 参数 构成 。 


表 4-1 SELECT“ F 4 


编号 T3 操作 输入 
1 FROM Join List of tables 
2 WHERE Restriction Logical predicate 
3 ORDER BY List of columns 
4 GROUP BY Restriction List of columns 
5 HAVING Restriction Logical predicate 
6 SELECT Restriction List of columns or expressions 
7 DISTINCT Restriction List of columns 
8 LIMIT Restriction Integer value 
9 OFFSET Restriction Integer value 


R2 


R6 Result 


NA 
SELECT DISTINCT heading FROM tables WHERE predicate GROUP BY columns HAVING predicate ORDER BY columns LIMIT int,int; 


图 4-3 SELECT phases 


R3 R7 


过 小 
t SELECTX SQL T X X 4e 434r 4- » RA WHERESE XE SELECT T RAFA » 


48. 

“ 值 " 可 以 按 它们 所 属 的 域 (或 类 型 ) 来 分 类 ， 如 数字 值 (1, 2, 3, etc) AFA F Me ("Jujy-Fruit") ° 4& 
可 以 表现 为 文字 的 值 (1, 2, 3 or “JujyFruit)、 变 量 (一 般 是 如 foods.name 的 列 名 )、 表 达 式 
(3+2/5) 或 函数 的 结果 (COUNT(foods.name)) 值 。 

操作 符 


操作 符 使 用 一 个 或 多 个 值 做 为 输入 并 产生 一 个 新 值 做 为 输出 。 这 所 以 叫 " 操 作 符 "是 因为 它 完成 
某 种 操作 并 产生 某 种 结果 。 二 目 操 作 符 操 作 两 个 输入 值 (或 称 操作 数 )， 三 目 操 作 符 操作 三 个 操 
作 数 ， 单 目 操作 符 操 作 一 个 操作 数 ， 等 等 。 


4-pm- -.- 


图 4-7 单 目 、 二 目 和 三 目 操作 符 


二 目 操作 符 


二 目 操作 符 是 最 常用 的 SQL 操作 符 。 表 4-2 列 出 了 SQLite 所 支持 的 二 目 操作 符 。 表 中 按 优先 级 
从 高 到 低 的 次 序 排列 ， 同 色 的 一 组 中 具有 相同 的 优先 级 ， 圆 括号 可 以 恬 盖 原 有 的 优先 级 。 


表 4-2 二 目 操作 符 


操作 符 


<< 


>> 


OR 
LIKE 
GLOB 


LIKE 操 作 符 


一 个 很 有 用 的 关系 操作 符 是 LIKE。LIKE 的 作用 与 相等 (=) 很 像 ， 但 却 是 通过 一 个 模板 来 进 
符 串 匹配 。 例 如 ， 要 查询 所 有 名 称 以 


$k 


String 
Arithmetic 
Arithmetic 
Arithmetic 
Arithmetic 
Arithmetic 
Bitwise 
Bitwise 
Logical 
Logical 
Relational 
Relational 
Relational 
Relational 
Relational 
Relational 
Relational 
Relational 
Logical 
Logical 
Logical 
Relational 


Relational 


y 


作用 
Concatenation 
Multiply 
Divide 
Modulus 
Add 
Subtract 
Right shift 
Left shift 
And 
Or 
Less than 
Less than or equal to 
Greater than 
Greater than or equal to 
Equal to 
Equal to 
Not equal to 


Not equal to 


String matching 


Filename matching 


"开始 的 食品 ， 可 使 用 如 下 语句 : 


和 


7c 


sqlite> SELECT id, name FROM foods WHERE name LIKE 'J%'; 
id name 

156 Juice box 

236 Juicy Fruit Gum 

243 Jello with Bananas 

244 JujyFruit 

245 Junior Mints 

370 Jambalaya 


模板 中 的 百 分 号 (%) 可 与 任意 0 到 多 个 字符 匹配 。 下 划 线 (_) 可 与 任意 单个 字符 匹配 。 


sqlite> SELECT id, name FROM foods WHERE name LIKE '%ac%P%'; 
id name 

127 Guacamole Dip 

168 Peach Schnapps 

198 Mackinaw Peaches 


另 一 个 有 用 的 窍门 是 使 用 NOT : 


sqlite> SELECT id, name FROM foods 

WHERE name like '%ac%P%' AND name NOT LIKE '%Sch%' 
id name 

38 Pie (Blackberry) Pie 

127 Guacamole Dip 

198 Mackinaw peaches 


限定 和 排序 


可 以 用 LIMIT 和 OFFSET 保 留 字 限 定 结果 集 的 大 小 和 范围 。LIMIT 指 定 返回 记录 的 最 大 数量 。 
OFFSET 指 定 偏 移 的 记录 数 。 例 如 ， 下 面 的 命令 返回 food_ types 表 中 id 排 第 2 的 记录 : 


SELECT * FROM food types LIMIT 1 OFFSET 1 ORDER BY id; 


保留 字 OFFSET 在 结果 集中 跳 过 一 行 (Bakery)， 保 留 字 LIMIT 限 制 最 多 返回 一 行 (Cereal)。 


上 面 语句 中 还 有 一 个 ORDER BY 子 句 ， 它 使 记录 集 在 返回 之 前 按 一 个 或 多 个 字段 的 值 排 序 。 
例如 : 


sqlite> SELECT * FROM foods WHERE name LIKE 'B%' 
ORDER BY type_id DESC, name LIMIT 10; 
id type_id name 

382 15 Baked Beans 

383 15 Baked Potato w/Sour 

384 15 Big Salad 

385 15 Broccoli 

362 14 Bouillabaisse 

328 12 BLT 

327 12 Bacon Club (no turke 

326 12 Bologna 

329 12 Brisket Sandwich 

274 10 Bacon 


Í 4x (Function) 4 7 4 (Aggregate) 


SQLite 提 供 了 多 种 内 置 的 函数 和 聚合， 可 以 用 在 不 同 的 子 句 中。 苞 数 的 种 类 包括 : 数学 函 
数 ， 如 ABS() 计 算 绝 对 值 ; 字符 串 格 式 函 数 ， 如 UPPER() 和 LOWER()， 它 们 将 字符 囊 的 值 转 
化 为 大 写 或 小 写 。 例 如 : 


sqlite&gt; SELECT UPPER('hello newman'), LENGTH('hello newman'), ABS(-12); 
UPPER('hello newman') LENGTH('hello newman') ABS(-12) 
HELLO NEWMAN 12 12 


IC ER RK) 5 f (3upper()fe UPPER()X IF] — 4 HA) ° i ZI VA dE Se FRAG 
数 : 


sqlite> SELECT id, UPPER(name), LENGTH(name) FROM foods 
WHERE type_id=1 LIMIT 10; 

id UPPER(name) LENGTH(name) 
BAGELS 6 

BAGELS, RAISIN 14 

BAVARIAN CREAM PIE 18 

BEAR CLAWS 10 

BLACK AND WHITE COOKIES 23 
BREAD (WITH NUTS) 17 
BUTTERFINGERS 13 

CARROT CAKE 11 

CHIPS AHOY COOKIES 18 
© CHOCOLATE BOBKA 15 


FOANDABRWNE 


因为 函数 可 以 是 任意 表达 式 的 一 部 分 ， 所 以 函数 也 可 以 用 在 WHERE 子 乡 中 : 


sqlite> SELECT id, UPPER(name), LENGTH(name) FROM foods 
WHERE LENGTH(name) < 5 LIMIT 5; 

id upper(name) length(name) 

36PIE 3 

48 BRAN 4 

56KIX 3 

57 LIFE 4 

80 DUCK 4 


聚合 是 一 类 特殊 的 函数 ， 它 从 一 组 记录 中 计算 聚合 值 。 标 准 的 聚合 函数 包括 SUM()、AVG()、 
COUNT(O、MIN() 和 MAX()。 例 如 ， 要 得 到 烘 烤 食品 (type_id=1) 的 数量 ， 可 使 用 如 下 语句 : 
sqlite> SELECT COUNT(*) FROM foods WHERE type_id=1; 


count 
47 


J/N 


分 组 (Grouping) 


聚合 的 精华 部 分 是 分 组 。 聚 合 不 只 是 能 够 计算 整个 结果 集 的 聚合 值 ， 你 还 可 以 把 结果 集 分 成 
多 个 组 ， 然 后 计算 每 个 组 的 聚合 值 。 这 些 都 可 以 在 一 步 当 中 完成 ， 方 法 就 是 使 用 GROUP BY 
Fagod: 


sqlite> SELECT type_id FROM foods GROUP BY type_id; 
type_id 

1 

2 

3 


15 


KEL 


操作 管道 中 的 下 一 个 限制 是 DISTINCT。DISTINCT 处 理 SELECT 的 结果 并 过 滤 掉 其 中 重复 的 
行 。 例 如 ， 你 想 从 foods 表 中 取得 所 有 不 同 的 type_id 值 : 


sqlite> SELECT DISTINCT type_id FROM foods; 
type_id 

1 

2 

3 


GRIER 


连接 (join) 是 SELECT 命令 的 第 一 个 操作 ， 它 产生 初始 的 信息 ， 供 语句 的 其 它 部 分 过 滤 和 处 
理 。 连 接 的 结果 是 一 个 合成 的 关系 (或 表 )， 它 是 SELECT 后 继 操作 的 输入 。 


也 许 从 一 个 例子 开始 是 最 简单 的 。 


sqlite> SELECT foods.name, food_types.name 
FROM foods, food_types 
WHERE foods.type_id=food_types.id LIMIT 10; 

name name 

Bagels Bakery 

Bagels, raisin Bakery 

Bavarian Cream Pie Bakery 

Bear Claws Bakery 

Black and White cookies Bakery 

Bread (with nuts) Bakery 

Butterfingers Bakery 

Carrot Cake Bakery 

Chips Ahoy Cookies Bakery 

Chocolate Bobka Bakery 


名 称 和 别名 
当 把 多 个 表 连 接 在 一 起 时 ， 字 段 可 能 重 名 。 


SELECT B.name FROM A JOIN B USING (a); 


修改 数据 


跟 SELECT 命 令 相 比 ， 用 于 修改 数据 的 语句 就 大 简单 太 容 易 理解 了 。 有 3 个 DML 语 句 用 于 修改 
数据 一 一 INSERT、UPDATE 和 DELETE ° 


插入 记录 


使 用 INSERT 命 令 向 表 中 插入 记录 。 使 用 INSERT 命 令 可 以 一 次 插入 1 条 记录 ， 也 可 以 使 用 
SELECT 命令 一 次 插入 多 条 记录 。INSERT 语 名 的 一 般 格式 为 : 


INSERT INTO table (column_list) VALUES (value_list); 


Table 指 明 数 据 插 入 到 哪个 表 中 。column _ list 是 用 运 号 分 隔 的 字段 名 表 ， 这 些 字段 必须 是 表 中 
存在 的 。value list 是 用 过 号 分 隔 的 值 表 ， 这 些 值 与 column _ list 中 的 字段 一 一 对 应 。 例 如 ， 下 
78 4) foods & 46 A BE : 


sqlite> INSERT INTO foods (name, type_id) VALUES ('Cinnamon Bobka', 1); 


修改 记录 


UPDATE 命 令 用 于 修改 一 个 表 中 的 记录 。UPDATE 命 令 可 以 修改 一 个 表 中 一 行 或 多 行 中 的 一 
个 或 多 个 字段 。UPDATE 语 名 的 一 般 格式 为 : 


UPDATE table SET update_list WHERE predicate; 


update_ list 是 一 个 或 多 个 “字段 赋值 ”的 列表 ， 字 段 赋值 的 格式 为 column_name=value。 
WHERE 子 多 的 用 法 与 SELECT 语句 相同 ， 确 定 需要 进行 修改 的 记录 。 如 : 


UPDATE foods SET name='CHOCOLATE BOBKA' 
WHERE name='Chocolate Bobka'; 
SELECT * FROM foods WHERE name LIKE 'CHOCOLATE%'; 
id type_ name 
10 1 CHOCOLATE BOBKA 
11 1 Chocolate Eclairs 
12 1 Chocolate Cream Pie 
222 9 Chocolates, box of 
223 9 Chocolate Chip Mint 
224 9 Chocolate Covered Cherries 


删除 记录 
DELETE 用 于 删除 一 个 表 中 的 记录 。DELETE 语 名 的 一 般 格式 为 : 


DELETE FROM table WHERE predicate; 


同样 ，WHERE 子 名 的 用 法 与 SELECT 语句 相同 ， 确 定 需 要 被 删除 的 记录 。 如 : 


DELETE FROM foods WHERE name='CHOCOLATE BOBKA'; 


数据 完整 性 


数据 完整 性 用 于 定义 和 保护 表 内 部 或 表 之 间 数 据 的 关系 。 有 四 种 完整 性 : 域 完整 性 、 实 体 完 
整 性 、 参 照 完整 性 和 用 户 定义 完整 性 。 


"E — BIR 


因为 唯一 (UNIQUE) 约 束 是 主键 的 基础 ， 所 以 先 介绍 它 。 一 个 唯一 约束 要 求 一 个 字段 或 一 组 字 
段 的 所 有 值 互 不 相同 ， 或 者 说 唯一 。 如 果 你 试图 插入 一 个 重复 值 ， 或 将 一 个 值 改 成 一 个 已 存 
在 的 值 ， 数 据 库 将 引发 一 个 约束 非法 ， 并 取消 操作 。 唯 一 约束 可 以 在 字段 级 或 表 级 定义 。 


NULL 和 UNIQUE : 
问题 : 如 果 一 个 字段 已 经 声明 为 UNIQUE， 可 以 向 这 个 字段 插入 多 少 个 NULL 值 ? 


回答 : 与 数据 库 的 种 类 有 关 。PostgreSQL 和 Oracle 可 以 插入 多 个 。|nformix 和 Microsoft SQL 
Server 只 能 一 个 。DB2、SQL Anywhere 和 Borland Inter-Base 不 能 。SQLite 采 用 了 与 
PostgreSQL 和 Oracle 相 同 的 解决 方案 。 


另 一 个 困扰 大 家 的 关于 NULL 的 经 典 问 题 是 : 两 个 NULL 值 是 否 相 等 ? 你 没有 足够 的 信息 来 证 
明 它 们 相等 ， 但 也 没有 足够 的 信息 证 明 它 们 不 等 。SQLite 的 观点 是 假设 所 有 的 NULL 都 是 不 同 
的 。 所 以 你 可 以 向 唯一 字段 中 插入 任意 多 个 NULL 值 。 


主键 约束 


在 SQLite 中 ， 当 你 定义 一 个 表 时 总 要 确定 一 个 主键 ， 不 管 你 自己 有 没有 定义 。 这 个 字段 是 一 
个 64-bit 整 型 字段 ， 称 为 ROWID。 它 还 有 两 个 别名 一 一 ROWID 和 OID， 用 这 两 个 别名 同样 可 
以 取 到 它 的 值 。 它 的 默认 取 值 按照 增 序 自动 生成 。SQLite 为 主键 字段 提供 自动 增长 特性 。 


默认 值 


保留 字 DEFAULT 为 字段 提供 一 个 默认 值 。 如 果 用 INSERT 语 名 插入 记录 时 没有 为 该 定做 指定 
值 ， 则 为 它 赋 默认 值 。DEFAULT 不 是 一 个 约束 (constraint)， 因 为 它 没有 强制 任何 事情 。 这 所 
以 把 它 归 为 域 完 整 性 ， 是 因为 它 提供 了 处 理 NULL 值 的 一 个 策略 。 如 果 一 个 字段 没有 指定 默认 
址 ， 在 插入 时 也 没有 为 该 字段 指定 值 ，SQLite 将 向 该 字段 插入 一 个 NULL。 例 如 ， 
contacts.name 字 段 有 一 个 默认 值 'UNKNOWN'， 请 看 下 面 例子 : 


sqlite> INSERT INTO contacts (name) VALUES ('Jerry'); 
sqlite> SELECT * FROM contacts; 

id name phone 

Jerry UNKNOWN 


DEFAULT 还 可 以 接受 3 种 预定 义 格 式 的 ANSI/ISO 预 定 字 用 于 生成 日 期 和 时 间 值 。 
CURRENT_TIME 将 会 生成 ANSI/ISO 格 式 (HH:MM:SS) 的 当前 时 间 » CURRENT. DATE Z A X, 
当前 日 期 (格式 为 YYYY-MM-DD)。CURRENT_TIMESTAMP 会 生成 一 个 日 期 时 间 的 组 合 ( 格 式 
为 YYYY-MM-DD HH:MM:SS)。 例 如 : 


CREATE TABLE times ( id int, 
date NOT NULL DEFAULT CURRENT_DATE, 
time NOT NULL DEFAULT CURRENT_TIME, 
timestamp NOT NULL DEFAULT CURRENT_TIMESTAMP ); 
INSERT INTO times(1); 
INSERT INTO times(2); 
SELECT * FROMS times; 
id date time timestamp 
1 2006-03-15 23:30:25 2006-03-15 23:30:25 
2 2006-03-15 23:30:40 2006-03-15 23:30:40 


NOT NULL 约 束 
CHECK75 Žž 


排序 法 (Collation) 


排序 法 定义 如 何 唯一 地 确定 文本 的 值 。 排 序 法 主要 用 于 规定 文本 值 如 何 进行 比较 。 不 同 的 排 
序 法 有 不 同 的 比较 方法 。 例 如 ， 某 种 排序 法 是 大 小 写 不 敏感 的 ， 于 

是 'JujyFruit 和 'JUJYFRUIT' 被 认为 是 相等 的 。 另 外 一 个 排序 法 或 许 是 大 小 写 敏感 的 ， 这 时 上 面 
两 个 字符 串 就 不 相等 了 。 


SQLite 有 3 种 内 置 的 排序 法 。 默 认为 BINARY， 它 使 用 一 个 C 函 数 memcmp() 来 对 文本 进行 逐 字 
节 的 比较 。 这 很 适合 于 大 多 数 西 方 语言 ， 如 美语 。NOCASE 对 26 个 字母 是 大 小 写 不 敏感 的 。 
Finally there is REVERSE, which is the reverse of the BINARY collation. REVERSE is more 
for testing (and perhaps illustration) than anything else. 


SQLite C API 提 供 了 一 种 创建 定制 排序 法 的 手段 ， 详 见 第 7 章 。 


存储 类 (Storage Classes) 


如 前 文 所 述 ，SQLite 在 处 理 数据 类 型 时 与 其 它 的 数据 库 不 同 。 区 别 在 于 它 所 支持 的 类 型 以 及 
这 些 类 型 是 如 何 存储 、 比 较 、 强 化 (enforc) 和 指派 (assign)。 下 面 各 节 介绍 SQLite 处 理 数据 类 
型 的 独特 方法 和 它 与 域 完整 性 的 关系 。 

对 于 数据 类 型 ，SQLite 的 域 完 整 性 被 称 为 域 亲 和 性 (affinity) 更 合适 。 在 SQLite 中 ， 它 被 称 为 类 
型 亲 和 性 (type affinity)。 为 了 理解 类 型 亲 和 性 ， 你 必须 先 要 理解 存储 类 和 弱 类 型 (manifest 
typing) ° 

SQLite 有 5 个 原始 的 数据 类 型 ， 被 称 为 存储 类 。 存 储 类 这 个 词 表明 了 一 个 值 在 磁盘 上 存储 的 格 
式 ， 其 实 就 是 类 型 或 数据 类 型 的 同义词 。 这 5 个 存储 类 在 表 4-6 中 描述 。 

表 4-6 SQLite 存 储 类 


名 称 说 明 


整数 值 是 全 数字 (包括 正和 负 )。 整 数 可 以 是 1, 2, 3, 4, 6 或 8 字 节 。 整 数 的 最 
大 范围 (8 bytes) 是 {-9223372036854775808, 0, 
+9223372036854775807}。SQLite 根 据 数字 的 值 自动 控制 整数 所 占 的 字 节 
数 。 空 注 : 参 可 变 长 整数 的 概念 。 

REAL 实数 是 10 进 制 的 数值 。SQLite 使 用 8 字 节 的 符 点 数 来 存储 实数 。 


文本 (TEXT) 是 字符 数据 。SQLite 支 持 几 种 字符 编码 ， 包 括 UTF-8 和 UTF- 


INTEGER 


TEAT 16 。 字 符 串 的 大 小 没有 限制 。 
BLOB 二 进 制 大 对 象 (BLOB) 是 任意 类 型 的 数据 。BLOB 的 大 小 没有 限制 。 
NULL NULL 表 示 没 有 值 。SQLite 具 有 对 NULL 的 完全 支持 。 


SQLite 通 过 值 的 表示 法 来 判断 其 类 型 ， 下 面 就 是 SQLite 的 推理 方法 : 
e SQL 语句 中 用 单 引号 或 双 引 号 括 起 来 的 文字 被 指派 为 TEXT 。 
e 如 果 文 字 是 未 用 引号 括 起 来 的 数据 ， 并 且 没 有 小 数 点 和 指数 ， 被 指派 为 INTEGER ° 
e 如 果 文 字 是 未 用 引号 括 起 来 的 数据 ， 并 且 带 有 小 数 点 或 指数 ， 被 指派 为 REAL 。 


e. 用 NULL 说 明 的 值 被 指派 为 NULL 存 储 类 。 


e 如 果 一 个 值 的 格式 为 XABCD'， 其 中 ABCD 为 16 进 制 数字 ， 则 该 值 被 指派 为 BLOB。X 前 
AKADE ET o 
SQL 函数 typeof() 根 据 值 的 表示 法 返回 其 存储 类 。 使 用 这 个 函数 ， 下 面 SQL 语 句 返 回 的 结果 
为 : 
sqlite> select typeof(3.14), typeof('3.14'), typeof(314), typeof(x'3142'), typeof(NULL); 


typeof(3.14) typeof('3.14') typeof(314) typeof (x'3142') typeof (NULL) 
real text integer blob null 


«| — He 





SQLite 单 独 的 一 个 字段 可 能 包含 不 同 存储 类 的 值 。 请 看 下 面 的 示例 : 


sqlite> DROP TABLE domain; 

sqlite> CREATE TABLE domain(x); 

sqlite> INSERT INTO domain VALUES (3.142); 
sqlite> INSERT INTO domain VALUES ('3.142'); 
sqlite> INSERT INTO domain VALUES (3142); 
sqlite> INSERT INTO domain VALUES (x'3142'); 
sqlite> INSERT INTO domain VALUES (NULL); 
sqlite> SELECT ROWID, x, typeof(x) FROM domain; 


返回 结果 为 : 
rowid x typeof (x) 
1 3.142 real 
2 3.142 text 
3 3142 integer 
4 1B blob 
5 NULL null 


这 带 来 一 些 问 题 。 这 种 字段 中 的 值 如 何 存储 和 比较 ?3 如 何 对 一 个 包含 了 INTEGER ` REAL ` 
TEXT、BLOB 和 NULL 值 的 字段 排序 ?一 个 整数 和 一 个 BLOB 如 何 比 较 ? 哪个 更 大 ? 它们 能 相 
答案 是 : 具有 不 同 存 储 类 的 值 可 以 存储 在 同一 个 字段 中 。 可 以 被 排序 ， 因 为 这 些 值 可 以 相互 
比较 。 有 完善 定义 的 规则 来 做 这 件 事 。 不 同 存储 类 的 值 可 以 通过 它们 各 自 类 的 “类 值 " 进 行 排 
序 ， 定 义 如 下 : 

1.NULL 存 储 类 具有 最 低 的 类 值 。 一 个 具有 NULL 存 储 类 的 值 比 所 有 其 它 值 都 小 (包括 其 它 具 有 
NULL 存 储 类 的 值 )。 在 NULL 值 之 间 ， 没 有 特别 的 可 排序 值 。 


2. INTEGER 或 REAL 存 储 类 值 高 于 NULL， 它 们 的 类 值 相 等 。INTEGER 值 和 REAL 值 通过 其 数 
值 进行 比较 。 


3. TEXT 存储 类 的 值 比 INTEGER 和 和 REAL 高。 数值 永远 比 字符 串 的 值 低 。 妆 两 个 TEXT 值 进 行 
比较 时 ， 其 值 大 小 由 "排序 法 "决定 。 


4. BLOB 存 储 类 具有 最 高 的 类 值 。 具 有 BLOB 类 的 值 大 于 其 它 所 有 类 的 值 。BLOB 值 之 问 在 比 
较 时 使 用 C 函 数 memcmp()。 


所 以 ， 当 SQLite 对 一 个 字段 进行 排序 时 ， 首 先 按 存储 类 排序 ， 然 后 再 进行 类 内 的 排序 (NULL 
类 内 部 各 值 不 必 排 序 )。 下 面 的 SQL 说 明了 存储 类 值 的 不 同 : 


sqlite> SELECT 3 < 3.142, 3.142 < '3.142', '3.142' < x'3000', x'3000' < x'3001'; 


返回 : 
3 < 3.142 gea cop '3.142' « x'3000' x'3000' « x'300 
1 1 1 1 


«| s 











45 X 7 (manifest typing) 


SQLite4£ Jt] 55 35 78 o 
看 下 面 的 表 : 


CREATE TABLE foo( x integer, 
y text, z real ); 


向 该 表 插 入 一 条 记录 : 


INSERT INTO foo VALUES ('1', '1', '1'); 


当 SQLite 创 建 这 条 记录 时 ，Xx、y 和 z 这 3 个 字段 中 存储 的 是 什么 类 
TEXT 和 REAL 。 


kx 
x 
~ 
Ds 
» 
Pu 
z 
+ 
ITI 
Q 
ITI 
A 


再 看 下 面 例子 : 


CREATE TABLE foo(x, y, Z); 


现在 执行 同样 的 插入 语句 : 


INSERT INTO foo VALUES ('1', '1', '1'); 


现在 ，X、y 和 z 中 存储 的 是 什么 类 型 呢 ? 答案 是 TEXT、TEXT 和 TEXT ° 
那么 ， 是 否 SQLite 的 字段 类 型 默认 为 TEXT 呢 ? 再 看 ， 还 是 第 2 个 表 ， 执 行 如 下 插入 语句 : 


INSERT INTO foo VALUES (1, 1.0, x'10'); 


现在 ，X、y 和 z 中 存储 的 是 什么 类 型 呢 ? 答 案 是 INTEGER、REAL 和 BLOB。 


如 果 你 愿意 ， 可 以 为 SQLite 的 字段 定义 类 型 ， 这 看 起 来 跟 其 它 数据 库 一 样 。 但 这 不 是 必须 
的 ， 你 可 以 尽管 违反 类 型 定义 。 这 是 因为 在 任何 情况 下 ，SQLite 都 可 以 接受 一 个 值 并 推断 它 


的 类 型 。 


总 之 ，SQLite 的 弱 类 型 可 表示 为 : 1) 字 段 可 以 有 类 型 ，2) 类 型 可 以 通过 值 来 推断 。 类 型 亲 和 性 
介绍 这 两 个 规定 如 何 相 互 关联 。 所 谓 类 型 亲 和 性 就 是 在 强 类 型 (strict typing) 和 动态 类 型 
(dynamic typing) 之 间 的 平衡 艺术 。 


类 型 亲 和 性 (Type Affinity) 


在 SQLite 中 ， 字 段 没 有 类 型 或 域 。 当 给 一 个 字段 声明 了 类 型 ， 该 字段 实际 上 仅仅 具有 了 该 类 
型 的 新 和 性 。 声 明 类 型 和 类 型 亲 和 性 是 两 回 事 。 类 型 亲 和 性 预定 SQLite 用 什么 存储 类 在 字段 
中 存储 值 。 在 存储 一 个 给 定 的 值 时 到 底 SQLite 会 在 该 字段 中 用 什么 存储 类 决定 于 值 的 存储 类 
和 字段 亲 和 性 的 结合 。 我 们 先 来 介绍 一 下 字段 如 何 获得 它 的 亲 和 性 。 


字段 类 型 和 亲 和 性 


首先 ， 每 个 字段 都 具有 一 种 亲 和 性 。 共 有 四 种 亲 和 性 : NUMERIC ` INTEGER ` TEXT 
NONE 。 一 个 字段 的 亲 和 性 由 它 预 声明 的 类 型 决定 。 所 以 ， 当 你 为 字段 声明 了 类 型 ， 从 根本 上 
说 是 为 字段 指定 了 亲 和 性 。SQLite 按 下 面 的 规则 为 字段 指派 亲 和 性 : 
e 默认 的 ， 一 个 字段 默认 的 亲 和 性 是 NUMERIC。 如 果 一 个 字段 不 是 INTEGER ` TEXT Xi, 
NONE £j > 4B È A zh X3 18 RA NUMERIC € Fr te © 
e 如 果 为 字段 声明 的 类 型 中 包含 了 'INT'( 无 论 大 小 写 )， 该 字段 被 指派 为 INTEGER 亲 和 性 。 
e 如 果 为 字段 声明 的 类 型 中 包含 了 'CHAR'、'CLOB' 或 TEXT'( 无 论 大 小 写 )， 该 字段 被 指派 为 
TEXT 亲 和 性 。 如 'VARCHAR' 包 含 了 'CHAR'， 所 以 被 指派 为 TEXT 亲 和 性 。 
e 如 果 为 字段 声明 的 类 型 中 包含 了 'BLOB'( 无 论 大 小 写 )， 或 者 没有 为 该 字段 声明 类 型 ， 该 字 
段 被 指派 为 NONE 亲 和 性 。 
ER: 如 果 没 有 为 字段 声明 类 型 ， 该 字段 的 亲 和 性 为 NONE ， 在 这 种 情况 下 ， 所 有 的 值 都 将 以 
它们 本 身 的 (或 从 它们 的 表示 法 中 推断 的 ) 存 储 类 存储 。 如 果 你 暂时 还 不 确定 要 往 一 个 字段 里 放 
什么 内 容 ， 或 准备 将 来 修改 ， 用 NONE 亲 和 性 是 一 个 好 的 选择 。 但 SQLite 默 认 的 亲 和 性 是 
NUMERIC。 例 如 ， 如 果 为 一 定 字段 声明 了 类 型 JUJYFRUIT， 该 字段 的 亲 和 性 不 是 NONE * 
为 SQLite 不 认识 这 种 类 型 ， 会 给 它 指 派 默 认 的 NUMERIC 亲 和 和 性。 所 以 ， 与 其 用 一 个 不 认识 的 
类 型 最 终 得 到 NUMERIC 亲 和 和 性， 还 不 如 不 为 它 指定 类 型 ， 从 而 使 它 得 到 NONE 亲 和 性 。 


亲 和 性 和 存储 


亲 和 性 对 值 如 何 存 储 到 字段 有 影响 ， 规 则 如 下 : 


。 一 个 NUMERIC 字 段 可 能 包括 所 有 5 种 存储 类 。 一 个 NUMERIC 字 段 具 有 数字 存储 类 的 偏好 
(INTEGER 和 REAL)。 当 一 个 TEXT 值 被 插入 到 一 个 NUMERIC 字 段 ， 将 会 试图 将 其 转化 
A INTEGER @ fi & ; 如 果 转 化 失败 ， 将 会 试图 将 其 转化 为 REAL 存 储 类 ; 如 果 还 是 失 
败 ， 将 会 用 TEXT 存储 类 来 存储 。 


e 一 个 INTEGER 字 上 段 的 处 理 很 像 NUMERIC 字 段 。 一 个 INTEGER 字 上段 会 将 REAL 值 按 REAL 
存储 类 存储 。 也 就 是 说 ， 如 果 这 个 REAL 值 没有 小 数 部 分 ， 就 会 被 转化 为 INTEGER 存 储 
类 。|INTEGER 字 上段 将 会 试 着 将 TEXT 值 按 REAL 存 储 ; 如 果 转 化 失败 ， 将 会 试图 将 其 转化 
A INTEGER 4 ë X ; 如 果 还 是 失败 ， 将 会 用 TEXT 存 储 类 来 存储 。 

e 一 个 TEXT 字段 将 会 把 所 有 的 INTEGER 或 REAL 值 转化 为 TEXT ° 

e 一 个 NONE 字 段 不 试图 做 任何 类 型 转化 。 所 有 值 按 它们 本 身 的 存储 类 存储 。 


e. 没有 字段 试图 向 NULL 或 BLOB 值 转化 一 如 无 论 用 什么 
按 本 来 的 方式 存储 在 所 有 字段 。 


亲 和 性 。NULL 和 BLOB 值 永远 都 


E Am 


| 初 看 起 来 比较 复杂 ， 但 总 的 设计 目标 很 简单 ， 就 是 : 如 果 你 需要 ，SQLite 会 尽量 模 
念 其 它 的 关系 型 数据 库 。 也 就 是 说 ， 如 果 你 将 SQLite 看 成 是 一 个 传统 数据 库 ， 类 型 亲 和 性 将 
会 按 你 的 期 望 来 存储 值 。 如 果 你 声明 了 一 个 INTEGER 字 段 ， 并 向 里 面 放 一 个 整数 ， 就 会 按 整 
数 来 存储 。 如 果 你 声明 了 一 个 具有 TEXT CHAR 或 VARCHAR 类 型 的 字段 并 向 里 放 一 个 整数 ， 
整数 将 会 转化 为 TEXT。 可 是 ， 如 果 你 不 遵守 这 些 规 定 ，SQLite 也 会 找到 办 法 来 存储 你 的 值 。 


亲 和 性 的 运行 


让 我 们 看 一 些 例子 来 了 解 亲 和 性 是 如 何 工作 的 : 


sqlite> 
sqlite> 
sqlite> 
sqlite> 
sqlite> 
sqlite> 


CREATE 
INSERT 
INSERT 
INSERT 
INSERT 
INSERT 
SELECT 


TABLE domain(i int, n numeric, t text, 


b blob); 


INTO domain VALUES (3.142,3.142,3.142,3.142); 
INTO domain VALUES ('3.142','3.142','3.142', '3.142'); 


INTO domain VALUES (3142,3142,3142,3142); 
INTO domain VALUES (x'3142' 
INTO domain VALUES (null,null,null,null); 


,X'3142',x'3142',x'3142' ); 


sqlite> ROWID, typeof(i),typeof(n),typeof(t),typeof(b) FROM domain; 


Bs 
Ej 


typeof(i) 
1 real 
2 real 
3 integer 
4 
5 


typeof(n) typeof(t) 
real text 
real text 
integer text 
blob blob 
null null 


typeof(b) 
real 
text 
integer 
blob 
null 


blob 
null 


下 面 的 SQL 说 明 存 储 类 的 排序 情况 


sqlite> SELECT ROWID，b，typeof(b) FROM domain ORDER BY b; 


g: 


i 


rowid b typeof(b) 

5 NULL null 

1 3.142 real 

3 3142 integer 

2 3.142 text 

4 1B blob 

sqlite> SELECT ROWID, b, typeof(b), b«1000 FROM domain ORDER BY b; 


返回 : 


rowid b typeof(b) b<1000 
NULL null NULL 

1 3.142 real 1 

3 3142 integer 1 

2 3.142 text 0 

4 1B blob 0 


存储 类 和 类 型 转换 


关于 存储 类 ， 需 要 关注 的 另 一 件 事 是 : 存储 类 有 时 会 影响 到 值 如 何 进行 比较 。 特 别 是 SQLite 
有 时 在 进行 比较 之 前 ， 会 将 值 在 数字 存储 类 (INTEGER 和 REAL) 和 TEXT 之 问 进行 转换 。 为 进 
行 二 进 制 的 比较 ， 遵 循 如 下 规则 : 


e 当 一 个 字段 值 与 一 个 表达 式 的 结果 进行 比较 ， 字 段 的 亲 和 性 会 在 比较 之 前 应 用 于 表达 式 
的 结果 。 


© 当 两 个 字段 值 进 行 比较 ， 如 果 一 个 字段 拥有 INTEGER 或 NUMERIC 亲 和 性 而 另 一 个 没 
有 ，NUMERIC 亲 和 性 会 应 用 于 非 NUMERIC 字 段 的 TEXT 值 。 


e 当 两 个 表达 式 进行 比较 ，SQLite 不 做 任何 转换 。 如 果 两 个 表达 式 有 相似 的 存储 类 ， 则 直 
接 按 它 们 的 值 进行 比较 ; 否则 按 类 值 进行 比较 。 
请 看 下 面 例子 : 


sqlite> select ROWID,b,typeof(i),i»'2.9' from domain ORDER BY b; 
rowid b typeof(i i>'2.9' 

5 NULL null NULL 

3.142 real 1 

3142 integer 1 

3.142 real 1 


1 
3 
2 
4 1B blob 1 


也 算是 “ 强 类 型 (STRICT TYPING)” 


如 果 你 需要 比 类 型 亲 和 性 更 强 的 域 完 整 性 ， 可 以 使 用 CHECK 约 束 。 你 可 以 使 用 一 个 单独 的 内 
置 函 数 和 一 个 CHECK 约 束 来 实现 一 个 “ 假 的 ? 强 类 型 。 


事务 


事务 定义 了 一 组 SQL 命令 的 边界 ， 这 组 命令 或 者 作为 一 个 整体 被 全 部 执行 ， 或 者 都 不 执行 。 
事务 的 典型 实例 是 转帐 。 


事务 的 范围 


事务 由 3 个 命令 控制 : BEGIN 、COMMIT 和 ROLLBACK。BEGIN 开 始 一 个 事务 ， 之 后 的 所 有 
操作 都 可 以 取消 。COMMIT 使 BEGIN 后 的 所 有 命令 得 到 确认 ; 而 ROLLBACK 还 原 BEGIN 之 后 
的 所 有 操作 。 如 : 


sqlite> BEGIN; 

sqlite> DELETE FROM foods; 

sqlite> ROLLBACK; 

sqlite> SELECT COUNT(*) FROM foods; 
COUNT(*) 

412 


上 面 开 始 了 一 个 事务 ， 先 删除 了 foods 表 的 所 有 行 ， 但 是 又 用 ROLLBACK 进 行 了 回 卷 。 再 执行 
SELECT 时 发 现 表 中 没 发 生 任 何 改 变 。 


SQLite 默 认 情 况 下 ， 每 条 SQL 语 句 自 成 事务 (自动 提交 模式 )。 


冲突 解决 

如 前 所 述 ， 违 反 约束 会 导致 事务 的 非法 结束 。 大 多 数 数据 库 ( 管 理 系 统 ) 都 是 简单 地 将 前 面 所 做 
的 修改 全 部 取消 。 

SQLite 有 其 独特 的 方法 来 处 理 约束 违反 (或 说 从 约束 违反 中 恢复 )， 被 称 为 冲突 解决 。 


如 : 


sqlite> UPDATE foods SET id-800-id; 
SQL error: PRIMARY KEY must be unique 


SQLite 提 供 5 种 冲突 解决 方案 : REPLACE » IGNORE ` FAIL >` ABORT ROLLBACK ° 


e REPLACE: 当 发 违反 了 唯一 完整 性 ，SQLite 将 造成 这 种 违反 的 记录 删除 ， 替 代 以 新 插入 
或 修改 的 新 记录 ，SQL 继 续 执行 ， 不 报错 。 


e IGNORE 
e FAIL 


e ABORT 


e ROLLBACK 


数据 库 锁 


在 SQLite 中 ， 锁 和 事务 是 紧密 联系 的 。 为 了 有 效 地 使 用 事务 ， 需 要 了 解 一 些 关 于 如 何 加 锁 的 


知识 。 


SQLite 采 用 粗放 型 的 锁 。 当 一 个 连接 要 写 数据 库 ， 所 有 其 它 的 连接 被 锁 住 ， 直 到 写 连 接 结束 
了 它 的 事务 。SQLite 有 一 个 加 锁 表 ， 来 帮助 不 同 的 写 数 据 库 都 能 够 在 最 后 一 刻 再 加 锁 ， 以 保 
证 最 大 的 并 发 性 。 


SQLite 使 用 锁 逐 步 上 升 机 制 ， 为 了 写 数 据 库 ， 连 接 需 要 乏 级 地 获得 排 它 锁 。SQLite 有 5 个 不 同 
的 锁 状 态 : 未 加 锁 (UNLOCKED)、 共 享 (SHARED)、 保 留 (RESERVED)、 未 决 (PENDING) 和 
排 它 (EXCLUSIVE)。 每 个 数据 库 连接 在 同一 时 刻 只 能 处 于 其 中 一 个 状态 。 每 种 状态 (未 加 锁 状 
态 除外 ) 都 有 一 种 锁 与 之 对 应 。 


最 初 的 状态 是 未 加 锁 状 态 ， 在 此 状态 下 ， 连 接 还 没有 存 取 数据 库 。 当 连接 到 了 一 个 数据 库 ， 
甚至 已 经 用 BEGIN 开 始 了 一 个 事务 时 ， 连 接 都 还 处 于 未 加 锁 状 态 。 


未 加 锁 状 态 的 下 一 个 状态 是 共享 状态 。 为 了 能 够 从 数据 库 中 读 (不 写 ) 数 据 ， 和 连接 必须 首先 进入 
共享 状态 ， 也 就 是 说 首先 要 获得 一 个 共享 锁 。 多 个 连接 可 以 同时 获得 并 保持 共享 锁 ， 也 就 是 
说 多 个 连接 可 以 同时 从 同一 个 数据 库 中 读数 据 。 但 哪怕 只 有 一 个 共享 锁 还 没有 释放 ， 也 不 允 
许 任何 连接 写 数据 库 。 

如 果 一 个 连接 想 要 写 数据 库 ， 它 必须 首先 获得 一 个 保留 锁 。 一 个 数据 库 上 同时 只 能 有 一 个 保 
留 锁 。 保 留 锁 可 以 与 共享 锁 共 存 ， 保 留 锁 是 写 数 据 库 的 第 1 阶段 。 保 留 锁 即 不 阻止 其 它 拥 有 共 
享 锁 的 连接 继续 读数 据 库 ， 也 不 阻止 其 它 连 接 获得 新 的 共享 锁 。 

一 旦 一 个 连接 获得 了 保留 锁 ， 它 就 可 以 开始 处 理 数据 库 修改 操作 了 ， 尽 管 这 些 修改 只 能 在 绥 
冲 区 中 进行 ， 而 不 是 实际 地 写 到 磁盘 。 对 读 出 内 容 所 做 的 修改 保存 在 内 存 缓冲 区 中 。 

当 连 接 想 要 提交 修改 (或 事务 ) 时 ， 需 要 将 保留 锁 提 升 为 排 它 锁 。 为 了 得 到 排 它 锁 ， 还 必须 首先 
将 保留 锁 提升 为 未 决 锁 。 获 得 未 决 锁 之 后 ， 其 它 连接 就 不 能 再 获得 新 的 共享 锁 了 ， 但 已 经 拥 
有 共享 锁 的 连接 仍然 可 以 继续 正常 读数 据 库 。 此 时 ， 拥 有 未 决 锁 的 连接 等 待 其 它 拥有 共享 锁 
的 连接 完成 工作 并 释放 其 共享 锁 。 

一 旦 所 有 其 它 共 享 锁 都 被 释放 ， 拥 有 未 决 锁 的 连接 就 可 以 将 其 锁 提 升 至 排 它 锁 ， 此 时 就 可 以 
自由 地 对 数据 库 进 行 修改 了 。 所 有 以 前 对 缓冲 区 所 做 的 修改 都 会 被 写 到 数据 库 文件 。 


死 锁 


为 什么 需要 了 解锁 的 机 制 呢 ? 为 了 避免 死 锁 。 


a 下 面 表 4-7 所 假设 的 情况 。 两 个 连接 一 人 和 B 同时 但 完全 独立 地 工作 于 同一 个 数据 


o A 执行 第 1 条 命令 ，B 执 行 第 >、3 条 ， 等 等 。 





RA-T 一 个 死 锁 的 假设 情况 


A 连接 B 连 接 
sqlite> BEGIN:; 
sqlite> BEGIN; 
sqlite> INSERT INTO foo VALUES ('x'); 
sqlite> SELECT * FROM foo; 
sqlite> COMMIT; 
SQL error: database is locked 
sqlite> INSERT INTO foo VALUES ('x’); 
SQL error: database is locked 
两 个 连接 都 在 死 锁 中 结束 。B 首 先 党 试 写 数据 库 ， 也 就 拥有 了 一 个 未 决 锁 。A 再 试图 写 ， 但 当 
其 INSERT 语 名 试图 将 共享 锁 提 升 为 保留 锁 时 失败 。 
为 了 讨论 的 方便 ， 假 设 连 接 A 和 B 都 一 直 等 待 数据 库 可 写 。 那 么 此 时 ， 其 它 的 连接 甚至 都 不 能 


够 再 读数 据 库 了 ， 因 为 B 拥 有 未 决 锁 ( 它 能 阻止 其 它 连接 获得 共享 锁 ) 。 那 么 时 此 ， 不 仅 A 和 B 不 
能 工作 ， 其 它 所 有 进程 都 不 能 再 操作 此 数据 库 了 。 


如 果 避 免 此 情况 呢 ? 当然 不 能 让 A 和 B 通 过 谈判 解决 ， 因 为 它们 甚至 不 知道 彼此 的 存在 。 答 案 
是 采用 正确 的 事务 类 型 来 完成 工作 。 


事务 的 种 类 


SQLite 有 三 种 不 同 的 事务 ， 使 用 不 同 US. R d 以 开始 于 : DEFERRED ` MMEDIATE 
或 EXCLUSIVE。 事 务 类 型 在 BEGIN 命 令 中 指定 


BEGIN [ DEFERRED | IMMEDIATE | EXCLUSIVE ] TRANSACTION; 


一 个 DEFERRED 事 务 不 获取 任何 锁 (直到 它 需要 锁 的 时 候 )，BEGIN 语 名 本 身 也 不 会 做 什么 事 
情 它 开 始 于 UNLOCK 状 态 。 默 认 情 况 下 就 是 这 样 的 ， 如 果 仅 仅 用 BEGIN 开 始 一 个 事务 ， 
那么 事务 就 是 DEFERRED 的 > ence 不 会 获取 任何 锁 ; 当 对 数据 库 进 行 第 一 次 读 操作 时 ， 它 
会 获取 SHARED 锁 ; 同样 ， 当 进行 第 一 次 写 操作 时 ， 它 会 获取 RESERVED 锁 。 





由 BEGIN 开 始 的 IMMEDIATE 事 务 会 党 试 获取 RESERVED 锁 。 如 果 成 功 ，BEGIN 
IMMEDIATE 保 证 没有 别 的 连接 可 以 写 数 据 库 。 但 是 ， 别 的 连接 可 at ide MD DR ; 但 
是 ，RESERVED 锁 会 阻止 其 它 连 接 的 BEGIN IMMEDIATE 或 者 BEGIN EXCLUSIVE 命 令 ， 当 


其 它 连接 执行 上 述 命令 时 ， 会 返回 SQLITE_BUSY 错 误 。 这 时 你 就 可 以 对 数据 库 进 行 修改 操作 
了 ， 但 是 你 还 不 能 提交 ， 当 你 COMMIT 时 ， 会 返回 SQLITE_BUSY 错 误 ， 这 意味 着 还 有 其 它 的 
读 事务 没有 完成 ， 得 等 它们 执行 完 后 才能 提交 事务 


EXCLUSIVE 事 务 会 试 着 获取 对 数据 库 的 EXCLUSIVE 锁 。 这 与 IMMEDIATE 类 似 ， 但 是 一 旦 成 
功 ，EXCLUSIVE 事 务 保证 没有 其 它 的 连接 ， 所 以 就 可 对 数据 库 进 行 读 写 操作 了 。 


上 节 那 个 例子 的 问题 在 于 两 个 连接 最 终 都 想 写 数据 库 ， 但 是 它们 都 没有 放弃 各 自 原来 的 锁 ， 
最 终 ，SHARED 锁 导致 了 问题 的 出 现 。 如 果 两 个 连接 都 以 BEGIN IMMEDIATE 开 始 事 务 ， 那 

么 死 锁 就 不 会 发 生 。 在 这 种 情况 下 ， 在 同一 时 刻 只 能 有 一 个 连接 进入 BEGIN IMMEDIATE， 其 
它 的 连接 就 得 等 待 。BEGIN IMMEDIATE 和 BEGIN EXCLUSIVE 通 常 被 写 事务 使 用 。 就 像 同 步 
机 制 一 样 ， 它 防止 了 死 锁 的 产生 。 


基本 的 准则 是 : 如 果 你 正在 使 用 的 数据 库 没 有 其 它 的 连接 ， 用 BEGIN 就 足够 了 。 但 是 ， 如 果 
你 使 用 的 数据 库 有 其 它 的 连接 也 会 对 数据 库 进行 写 操作 ， 就 得 使 用 BEGIN IMMEDIATE Xi 
BEGIN EXCLUSIVE 开 始 你 的 事务 


wp = AK 
数据 库 官 理 
数据 库 管 理 用 于 控制 数据 库 如 何 操作 。 从 SQL 的 角度 ， 数 据 库 管理 包括 一 些 主题 如 会 视图 


(view)、 触 发 器 (trigger) 和 索引 (indexe)。 另 外 ，SQLite 包 括 自己 一 些 独特 的 管理 ， 如 数据 库 
pragma ， 可 以 用 来 配置 数据 库 参 数 。 


视图 


物化 的 视图 


在 关系 模型 中 称 为 数据 可 修改 的 视图 。 


索引 
索引 的 利用 


理解 索引 何 时 被 利用 及 何 时 不 被 利用 是 重要 的 。SQLite 有 明确 的 条 件 来 决定 是 否 使 用 索引 。 
如 果 可 能 ， 在 WHERE 子 名 中 有 下 列表 达 式 时 ，SQLite 将 使 用 单字 段 索引 : 

column {=|>|>=|<=|<} expression 

expression {=|>|>=|<=|<} column 


column IN (expression-list) 
column IN (subquery) 


多 字段 索引 的 使 用 有 很 明确 的 条 件 。 这 最 好 用 例子 来 说 。 假 设 你 有 如 下 定义 的 一 个 表 : 


CREATE TABLE foo (a,b,c,d); 


fik RE 


当 特 定 的 表 上 发 生 特 定 的 数据 库 事件 时 ， 触 发 器 会 执行 特定 的 SQL 命 令 。 创 建 触 发 器 的 一 般 
语法 如 下 : 


CREATE [TEMP|TEMPORARY] TRIGGER name [BEFORE|AFTER] 
[INSERT|DELETE|UPDATE|UPDATE OF columns] ON table 
action 


UPDATE #& X 25 


不 同 于 INSERT and DELETE R & > UPDATEAKRAR ZT AELE- NRA 8g FACE 9 
The general form of this kind of trigger is as follows: 


CREATE TRIGGER name [BEFORE|AFTER] UPDATE OF column ON table 
action 


The following is a SQL script that shows an UPDATE trigger in action: 


.h on 
.m col 
.w 50 
.echo on 
CREATE TEMP TABLE log(x); 
CREATE TEMP TRIGGER foods update log UPDATE of name ON foods 
BEGIN 
INSERT INTO log VALUES('updated foods: new name=' || NEW.name); 
END; 
BEGIN; 
UPDATE foods set name='JUJYFRUIT' where name='JujyFruit'; 
SELECT * FROM log; 
ROLLBACK; 


错误 处 理 

定义 一 个 事件 的 before 触 发 器 给 了 你 一 个 阻止 事件 发 生 的 机 会 。before 触 发 器 可 以 实现 新 的 完 
整 性 约束 。SQLite 为 触发 器 提供 了 一 个 称 为 RAISE() 的 特殊 SQL 函数 ， 可 以 在 触发 器 体 中 唤起 
一 个 错误 。RAISE 如 下 定义 : 


RAISE(resolution, error message); 


使 用 触发 器 的 外 键 约束 


在 SQLite 中 ， 和 触发 器 最 有 趣 的 应 用 之 一 是 实现 外 键 约束 。 为 了 进一步 了 解 触 发 器 ， 我 将 用 这 
个 想法 在 foods 表 和 food types 表 之 间 实 现 外 键 。 


附加 (Attaching) 数 据 库 


SQLite 人 允许 你 用 ATTACH 命 令 将 多 个 数据 库 “ 附 加 "到 当前 连接 上 来 。 妆 你 附加 了 一 个 数据 库 ， 
它 的 所 有 内 容 在 当前 数据 库 文 件 的 全 局 范围 内 都 是 可 存 取 的 。ATTACH 的 语法 为 : 


ATTACH [DATABASE] filename AS database_name; 


清洁 数据 库 


SQLite 有 两 个 命令 用 于 数据 库 清 洁 
两 种 形式 : 





REINDEX4? VACUUM 。REINDEX 用 于 重建 索引 ， 有 


REINDEX collation_name; 
REINDEX table_name|index_name; 


第 一 种 形式 利用 给 定 的 排序 法 名 称 重新 建立 所 有 的 索引 。 


VACUUM 通过 重建 数据 库 文 件 来 清除 数据 库 内 所 有 的 未 用 空间 。 


数据 库 配 置 


SQLite 没 有 配置 文件 。 所 有 这 些 配 置 参数 都 是 用 pragma 来 实现 。Pragma 以 独特 的 方式 工 
作 ， 有 些 像 变 量 ， 又 有 些 像 命令 。 


连接 缓冲 区 大 小 


缓冲 区 尺寸 pragma 控 制 一 个 连接 可 以 在 内 存 中 使 用 多 少 个 数据 库 页 。 要 查看 当前 缓冲 区 大 小 
的 默认 值 ， 执 行 : 


sqlite> PRAGMA cache_size; 
cache_size 
2000 


要 改变 缓冲 区 大 小 ， 执 行 : 


sqlite> PRAGMA cache_size=10000; 
sqlite> PRAGMA cache_size; 
cache_size 

10000 


获得 数据 库 信 息 
可 以 使 用 数据 库 的 Schema pragma 来 获得 数据 库 信 息 ， 定 义 如 下 : 
e database list: Lists information about all attached databases. 


e index info: Lists information about the columns within an index. It takes an index name 
as an argument. 


e index list: Lists information about the indexes in a table. It takes a table name as an 
argument. 


e table info: Lists information about all columns in a table. 


请 看 下 面 示例 : 


sqlite> PRAGMA database_list; 

seq name file 

9 main /tmp/foods.db 

2 db2 /tmp/db 

sqlite> CREATE INDEX foods name type idx ON foods(name,type id); 
sqlite> PRAGMA index info(foods name type idx); 
seqn cid name 

9 2 name 

1 1 type id 

sqlite> PRAGMA index list(foods); 

seq name unique 

© foods name type idx 0 

sqlite> PRAGMA table info(foods); 

cid name type notn dflt pk 

© id integer © 1 

1 type id integer 0 0 

2 name text 0 0 


页 大 小 、 编 码 和 自动 排 空 


The database page size, encoding, and autovacuuming must be set before a database is 
created. That is, in order to alter the defaults, you must first set these pragmas before 
creating any database objects in a new database. The defaults are a 1,024-byte page size 
and UTF-8 encoding. SQLite supports page sizes ranging from 512 to 32,786 bytes, in 
powers of 2. Supported encodings are UTF-8, UTF-16le (little-endian UTF-16 encoding), 
and UTF-16be (big-endian UTF-16 encoding). 


to RAK FA auto_vacuum pragma， 可 以 使 数据 库 自 动 维持 最 小 。 一 般 情况 下 ， 当 一 个 事务 从 数 
据 库 中 删除 了 数据 并 提交 后 ， 数 据 库 文件 的 大 小 保持 不 变 。 当 使 用 了 auto_vacuum pragma 
后 ， 当 删除 事务 提交 时 ， 数 据 库 文件 会 自动 缩小 。 


sqlite_master 表 是 一 个 系统 表 ， 它 包含 数据 库 中 所 有 表 、 视 图 、 索 引 和 触发 器 的 信息 。 


如 ，foods 的 当前 内 容 如 下 : 


sqlite> SELECT type, name, rootpage FROM sqlite_master; 


type name rootpage 
table episodes 2 

table foods 3 

table foods_episodes 4 
table food_types 5 

index foods name idx 30 

table sqlite sequence 50 
trigger foods update trg 0 

trigger foods insert trg O 

trigger foods delete trg 0 


有 关 sqlite_master 表 的 结构 请 参考 第 2 章 的 “获得 数据 库 的 Schema 信息 "一 


sqlite_master 包 含 一 个 称 为 Sql 的 字段 ， 存 储 了 创建 对 象 的 DDL 命 令 ， 如 : 


sqlite> SELECT sql FROM sqlite_master WHERE name='foods_update_trg'; 
返回 : 


CREATE TRIGGER foods_update_trg 
BEFORE UPDATE OF type_id ON foods 
BEGIN 

SELECT CASE 

WHEN (SELECT id FROM food_types WHERE id=NEW.type_id) IS NULL 
THEN RAISE( ABORT, 

"Foreign Key Violation: foods.type_id is not in food_types.id') 
END; 
END 


查看 Query 的 执行 


a 


P o 


可 以 用 EXPLAIN 命 令 查看 SQLite 执 行 一 个 查询 的 方法 。EXPLAIN 列 出 一 个 SQL 命令 编译 后 


VDBE 程 序 。 


例 


的 


sqlite> .m col 
sqlite> .h on 


sqlite> 

sqlite> 

addr opcode 

0 Trace 

1 Goto 

2 OpenRead 

3 Rewind 

4 Rowid 

5 Column 

6 Column 

7 ResultRow 

8 Next 

9 Close 

10 Halt 

11 Transaction 
12 VerifyCookie 
13 TableLock 


Goto 


OOOOOOOPOOOOOOO 


W415 33 3 10 3 
EXPLAIN SELECT * FROM foods; 
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comment 


第 5 章 设计 和 概念 


本 章 为 后 面 的 3 章 打下 基础 ， 这 几 章 专注 于 SQLite 编 程 。 这 几 章 专注 于 作为 程序 员 ， 在 编码 时 
你 所 应 该 了 解 的 有 关 SQLite 的 东西 。 无 论 你 是 用 C 语 言 对 SQLite 进 行 编程 ， 还 是 用 其 它 的 编程 
语言 ， 这 些 内 容 都 是 重要 的 。 它 不 仅 帮助 你 了 解 API， 还 包括 部 分 有 关 SQLite 的 体系 结构 和 实 
现 方 法 的 内 容 。 具 备 了 这 些 知 识 ， 你 就 可 以 编 出 更 好 的 代码 ， 这 些 代码 执行 得 更 快 ， 且 不 会 

产生 死 锁 、 不 可 预知 错误 等 问题 。 你 会 看 到 SQLite 如 何 处 理 你 的 代码 ， 你 还 会 变 得 更 加 自 

信 ， 因 为 你 知道 自己 正 前 进 在 解决 问题 的 正确 方向 上 。 


你 不 需要 从 头 到 尾 地 读 内 部 代码 才能 理解 这 些 内 容 ， 你 也 不 必 是 一 个 C 程 序 员 。SQLite 的 设计 
和 概念 都 是 非常 直观 和 容 多 理解 的 。 只 有 一 小 部 分 内 容 你 需要 知道 ， 本 章 就 介绍 这 些 内 容 。 


1: 明显 地 ， 你 需要 知道 API 是 如 何 工作 的 。 于 是 本 章 从 一 个 对 API 概 念 性 的 介绍 开始 ， 图 示 了 
主要 的 数据 结构 ，API 的 一 般 设 计 和 它 主要 的 函数 。 还 可 以 看 到 SQLite 的 一 些 主要 的 子 系统 ， 
这 些 子 系统 在 查询 的 处 理 过 程 中 起 着 重要 作用 。 


2: 除了 知道 什么 函数 做 什么 ， 你 还 需要 从 比 API 高 的 角度 来 看 问题 ， 看 看 所 有 这 些 函数 在 事 

务 (transactions) 中 是 如 何 操作 的 。SQLite 的 所 有 的 工作 都 是 在 事务 中 完成 的 。 于 是 ， 你 需要 

知道 在 API 之 下 ， 事 务 如 何 按照 锁 的 约束 来 工作 。 如 果 你 不 知道 锁 是 如 何 操作 的 ， 这 些 锁 就 会 
导致 问题 。 当 对 锁 有 所 了 解 之 后 ， 你 不 仅 可 以 避免 潜在 的 并 发 问题 ， 还 可 以 通过 编程 控制 它 

们 来 优化 你 的 查询 。 


3 - 最 后 ， 你 还 必须 理解 如 何 将 这 些 内 容 应 用 于 编码 。 本 章 的 最 后 部 分 会 将 3 个 主题 结合 在 一 
起 一 API、 事务 和 锁 ， 并 且 看 一 看 好 代码 与 坏 代 码 的 区 别 。 





空 注 : 本 章 看 得 还 是 比较 仔细 的 ， 翻 译 的 也 比较 全 。 


API 
从 功能 的 角度 来 区 分 ，SQLite 的 API 可 分 为 两 类 : 核心 API 的 扩充 API。 核 心 API 由 所 有 完成 基 
本 数据 库 操作 的 函数 构成 ， 包 括 : 连接 数据 库 、 执 行 SQL 和 遍历 结果 集 。 它 还 包括 一 些 功 能 


函数 ， 用 来 完成 字符 串 格式 化 、 操 作 控 制 、 调 试 和 错误 处 理 等 任务 。 扩 充 API 提 供 不 同 的 方法 
来 扩展 SQLite， 它 使 你 能 够 创建 自 定 义 的 SQL 扩展 ， 并 与 SQLite 本 身 的 SQL 相 集 成 。 


SQLite 版 本 3 的 新 特性 


在 开始 之 前 ， 我 们 先 讨 论 一 下 SQLite 版 本 3 的 新 特色 : 


一 、 首 先 ，SQLite 的 API 被 彻底 重新 设计 了 ， 并 具有 了 许多 新 特性 。 由 第 二 版 的 15 个 函数 增加 
到 88 个 函数 。 这 些 函 数 包括 支持 UTF-8 和 UTF-16 编 码 的 功能 函数 。SQLite3 有 一 个 更 方便 的 
查询 模式 ， 使 查询 的 预 处 理 更 容易 并 且 支 持 新 的 参数 绑 定 方法 。SQLite3 还 增加 了 用 户 定义 的 
排序 序列 、CHECK 约 束 、64 位 的 键 值 和 新 的 查询 优化 。 


二 、 在 后 端 大 大 地 改进 了 并 发 性 能 。 加 锁 子 系统 引进 了 一 种 新 的 锁 升 级 模型 ， 解 决 了 第 二 版 
中 的 写 进程 狐 死 的 问题 。 这 种 模型 保证 写 进程 按照 先 来 先 服务 的 算法 得 到 排 它 锁 (Exclusive 
Lock)。 基 至， 写 进 程 通过 把 结果 写 入 临时 缓冲 区 (Temporary Buffer)， 可 以 在 得 到 排 它 锁 之 前 
就 开始 工作 。 这 对 于 写 要 求 较 高 的 应 用 ， 性 能 可 提高 400% © 


= > SQLite 3 包含 一 个 改进 了 的 B-tree 模 型 。 现 在 对 库 表 使 用 B+tree， 大 大 提高 查询 效率 ， 存 
储 大 数据 字段 更 有 效 ， 并 可 以 从 磁盘 上 删除 不 用 了 的 字段 。 其 结果 是 数据 库 文件 的 体积 减 小 
了 25-35% 并 改善 了 全 面 性 能 。B+tree 将 在 第 9 章 介绍 。 


四 、SQLite 3 最 重要 的 改变 是 它 的 存储 模型 。 由 第 二 版 只 支持 文本 模型 ， 扩 展 到 支持 5 种 本 地 
数据 类 型 ， 如 第 4 章 所 介绍 的 ， 还 增强 了 弱 类 型 和 类 型 亲 和 性 的 概念 。 每 种 类 型 都 被 优化 ， 以 
得 到 更 高 的 查询 性 能 并 战 用 更 少 的 存储 空间 。 例 如 ， 整 数 和 浮 点 数 以 二 进 制 的 形式 存储 ， 而 
不 再 是 以 ASCII 形 式 存储 ， 这 样 ， 就 不 必 再 对 VWVHERE 子 名 中 的 值 进行 转换 ( 像 第 2 版 那样 )。 弱 
类 型 使 你 能 够 在 定义 一 个 字段 时 选择 是 否 预 声明 类 型 。 亲 和 性 确定 一 个 值 存 储 于 字段 的 格式 
一 一 基于 值 的 表示 法 和 列 的 亲 和 性 。 类 型 亲 和 性 与 弱 类 型 紧密 关联 一 列 的 亲 和 性 由 其 类 型 
的 声明 确定 。 


在 很 多 方面 ，SQLite 3 是 一 个 与 SQLite 2 完全 不 同 的 数据 库 ， 并 且 提 供 了 很 多 在 适应 性 、 特 色 
和 性 能 方面 的 改进 。 


主要 的 数据 结构 


在 第 1 章 你 看 到 了 很 多 SQLite 组 件 一 “分词 器 、 分 析 器 和 虚拟 机 等 等 。 但 是 从 程序 员 的 角度 ， 





Connection 1 Connection 2 


| Cursor | | Cursor | | Cursor | | Cursor | 








Table Locks 
Database Locks 


Database File Journal File 


图 5-1 SQLite C API 对 象 模型 


从 技术 上 来 说 ，B-tree 和 pager 不 是 API 的 一 部 分 ， 但 是 它们 却 在 事务 和 锁 上 起 着 关键 作用 。 这 
里 只 介绍 关联 的 内 容 ， 详 细 内 容 将 在 "事务 "一 节 介绍 。 


Æ i£ (Connection)? 14 4] (Statement) 


连接 (Connection) 和 语句 (Statement) 是 执行 SQL 命 令 涉及 的 两 个 主要 数据 结构 ， 几 乎 所 有 通 
过 API 进 行 的 操作 都 要 用 到 它们 。 连 接 代表 在 一 个 独立 的 事务 环境 下 的 一 个 单独 的 数据 库 连 

接 。 每 个 语句 都 和 一 个 连接 关联 ， 通 常 表 示 一 个 编译 过 的 SQL 语句 。 在 内 部 ， 它 以 VDBE 字 节 
码 表示 。 语 名 包括 执行 一 个 命令 所 需要 一 切 ， 包 括 保 存 VDBE 程 序 执行 状态 所 需 的 资源 ， 指 向 
硬盘 记录 的 B-tree 游 标 ， 以 及 参数 等 等 。 


B-tree 和 Pager 


一 个 连接 可 以 有 多 个 database 对 象 一 ”一 个 主 数据 库 和 附加 的 数据 库 。 每 一 个 数据 库 对 象 有 
一 个 B-tree 对 象 ， 一 个 B-tree 有 一 个 pager 对 象 (这 里 的 对 象 不 是 面向 对 象 的 “对象 "， 只 是 为 了 
说 清楚 问题 ) 。 


语 名 最 终 都 是 通过 连接 的 B-tree 和 pager 从 数据 库 读 或 者 写 数 据 ， 通 过 B-tree 的 游标 (curson) 遍 
历 存 储 在 页 (page) 中 的 记录 。 在 游标 访问 页 之 前 ， 页 必须 从 磁盘 加 载 到 内 存 ， 而 这 就 是 pager 
的 任务 。 任 何 时候 ， 如 果 B-tree 需 要 页 ， 它 都 会 请 求 pager 从 磁盘 读 取 数 据 ，pager 把 页 加 载 到 
页 缓冲 区 (page cache)。 之 后 ，B-tree 和 与 之 关联 的 游标 就 可 以 访问 位 于 页 中 的 记录 了 。 


如 果 游 标 改 变 了 页 ， 为 了 防止 事务 回 滚 ，pager 必 须 采 取 特 殊 的 方式 保存 原来 的 页 。 总 的 来 
说 ，pager 负 责 读 写 数据 库 ， 管 理 内 存 缓存 和 页 ， 以 及 管理 事务 、 锁 和 前 溃 恢 复 (这 些 在 " 事 
务 "一 节 会 详细 介绍 ) 。 


2| Ae 


总 之 ， 关 于 连接 和 事务 ， 你 必须 知道 两 件 事 : (1) 对 数据 库 的 任何 操作 ， 一 个 连接 存在 于 一 个 
事务 之 下 。(2) 一 个 连接 绝 不 会 同时 存在 于 多 个 事务 之 下 。 无 论 何 时 ， 一 个 连接 在 对 数据 库 做 
任何 操作 时 ， 都 总 是 在 恰好 一 个 事务 之 下 ， 不 会 多 ， 也 不 会 少 。 


核心 API 


核心 AP| 主 要 与 执行 SQL 命 令 有 关 。 有 两 种 方法 执行 SQL 语 句 : 预 编译 查询 和 封装 查询 。 预 编 
译 查询 由 三 个 阶段 构成 : 、 执 行 (execution) 和 定案 (finalization)。 其 实 封闭 
装 查询 只 是 对 预 编译 查询 的 三 个 过 程 进行 了 包装 而 已 ， 最 终 也 会 转化 为 预 编 译 查询 来 执行 。 


连接 的 生命 周期 (The Connection Lifecycle) 


和 大 多 数据 库 连 接 相 同 ， 其 生命 周期 由 三 个 阶段 构成 : 
1. 连接 数据 库 (Connect to the database)。 


2. 处 理事 务 (Perform transactions) : 如 你 所 知 ， 任 何 命令 都 在 事务 下 执行 。 默 认 情 况 下 ， 事 
务 自动 提交 ， 也 就 是 每 一 个 SQL 语句 都 在 一 个 独立 的 事务 下 运行 。 当 然 也 可 以 通过 使 用 
BEGIN..COMMIT 手 动 提交 事务 


3. 断 开 连 接 (Disconnect from the database) : 关闭 数据 库 文件 。 还 要 关闭 所 有 附加 的 数据 库 
文件 。 


在 查询 的 处 理 过 程 中 还 包括 其 它 一 些 行为 ， 如 处 理 错误 、“ 忙 " 句 枉 和 schema 改 变 等 ， 所 有 这 
些 都 将 在 utility functions 一 节 中 介绍 。 


连接 数据 库 (Connect to the database): 


连接 数据 库 不 只 是 打开 一 个 文件 。 每 个 SQLite 数 据 库 都 存储 在 单独 的 操作 系统 文件 中 一 一 数 
据 库 与 文件 一 一 对 应 。 连 接 、 打 开 数 据 库 的 C API 为 sqlite3_open()， 它 只 是 一 个 简单 的 系统 
调用 ， 来 打开 一 个 文件 ， 它 的 实现 位 于 main.c 文 件 中 。 


SQLite 还 可 以 创建 内 存 数据 库 。 如 果 你 使 用 :memory: 或 一 个 空 字 符 串 做 数据 库 名 ， 数 据 库 将 
在 RAM 中 创建 。 内 存 数 据 库 将 只 能 被 创建 它 的 连接 所 存 取 ， 不 能 与 其 它 连接 共享 。 另 外 ， 内 
存 数据 库 只 能 存活 于 连接 期 间 ， 一 旦 连接 关闭 ， 数 据 库 就 将 从 内 存 中 被 删除 。 


当 连 接 一 个 位 于 磁盘 上 的 数据 库 时 ， 如 果 数 据 库 文件 存在 ， 则 打开 该 文件 ; 如 果 不 存 在 ， 
SQLite 会 假定 你 想 创建 一 个 新 的 数据 库 。 在 这 种 情况 下 ，SQLite 不 会 立即 在 磁盘 上 创建 一 个 
文件 ， 只 有 当 你 向 数据 库 写 入 数据 时 才 会 创建 文件 ， 比 如 : 创建 表 、 视 图 或 者 其 它 数据 库 对 


象 。 如 果 你 打开 一 个 数据 库 ， 不 做 任何 事 ， 然 后 关闭 它 ，SQLite 会 创建 一 个 文件 ， 但 只 是 一 
个 长 度 为 0 的 空 文件 而 已 。 


另外 一 个 不 立即 创建 新 文件 的 原因 是 ， 一 些 数据 库 的 参数 ， 比 如 : 编码 ， 页 大 小 等 ， 只 能 在 
数据 库 创建 之 前 设置 。 默 认 情况 下 ， 页 大 小 为 1024 字 节 ， 但 是 你 可 以 选择 512-32768 字 节 之 
间 为 2 血 数 的 数字 。 有 些 时 候 ， 较 大 的 页 能 更 有 效 地 处 理 大 量 的 数据 。 你 可 以 使 用 page_size 
pragma 来 设置 数据 库 页 大 小 。 


字符 编码 是 数据 库 的 另 一 个 永久 设置 。 你 可 以 使 用 encoding pragma 来 设置 字符 编码 ， 其 值 可 
以 是 UTF-8、UTF-16、UTF-16le (little endian)fe UTF-16be (big endian) ° 


执行 预 处 理 查 询 


前 面 提 到 ， 预 处 理 查询 (Prepared Query) 是 SQLite 执 行 所 有 SQL 命令 的 方式 ， 包 括 以 下 三 个 步 
Ke: 


(1) £ & (preparation) : 


21 74] R (tokenizer) 、 分 析 器 (parser) 和 代码 生成 器 (code generator) 把 SQL 语 句 编 译 成 VDBE 字 
节 码 ， 编 译 器 会 创建 一 个 语句 句柄 (sqlite3_stmt)， 它 包括 字 节 码 以 及 其 它 执 行 命令 和 遍历 结 
果 集 所 需 的 全 部 资源 。 相 应 的 C API 为 sqlite3_prepare()， 位 于 prepare.c 文 件 中 。 


(2) 执行 (execution) : 


虚拟 机 执行 字 节 码 ， 执 行 过 程 是 一 个 步 进 (stepwise) 的 过 程 ， 每 一 步 (step) 由 sqlite3_step() 启 
动 ， 并 由 VDBE 执 行 一 段 字 节 码 。 当 第 一 次 调用 sqlite3_step() 时 ， 一 般 会 获得 一 种 锁 ， 锁 的 种 
类 由 命令 要 做 什么 ( 读 或 写 ) 决 定 。 对 于 SELECT 语 句 ， 每 次 调用 sqlite3_step() 使 用 语句 句柄 的 
游标 移 到 结果 集 的 下 一 行 。 对 于 结果 集中 的 每 一 行 ， 它 返回 SQLITE_ROW， 当 到 达 结 果 末 尾 
时 ， 返 回 SQLITE_DONE。 对 于 其 它 SQL 语句 (INSERT、UPDATE、DELETE 等 )， 第 一 次 调 
用 sqlite3_step() 就 导致 VDBE 执 行 整个 命令 。 


(3) 定案 (finalization) : 


VDBE 关 闭 语句 ， 释 放 资 源 。 相 应 的 C AP| 为 sqlite3_finalize()， 它 导致 VDBE 结 束 程序 运行 并 
关闭 语句 句柄 。 如 果 事 务 是 由 人 工控 制 开始 的 ， 它 必须 由 人 工控 制 进行 提交 或 回 卷 ， 否 则 
sqlite3_finalize() 会 返回 一 个 错误 。 当 sqlite3_finalize() 执 行 成 功 ， 所 有 与 语句 对 象 关联 的 资源 
都 将 被 释放 。 在 自动 提交 模式 下 ， 还 会 释放 关联 的 数据 库 锁 。 


每 一 步 (preparation、execution 和 finalization) 都 关联 于 语句 句柄 的 一 种 状态 (prepared、active 
和 finalized)。Pepared 表 示 所 有 资源 都 已 分 配 ， 语 和 句 已 经 可 以 执行 ， 但 还 没有 执行 。 现 在 还 没 
有 申请 锁 ， 一 直到 调用 sqlite3_step() 时 才 会 申请 锁 。Active 状 态 开 始 于 对 sqlite3_step() 的 调 
用 ， 此 时 语句 正在 被 执行 并 拥有 茶 种 锁 。Finalized 意 味 着 语句 已 经 被 关闭 且 所 有 相关 资源 已 
经 被 释放 。 通 过 图 5-2 可 以 更 容易 地 理解 该 过 程 : 


SQLite 权威 指南 


Compilation 


Prepared 


statement 


Active 





Finalization 


图 5-2 语句 处 理 


下 面 代码 例 示 了 在 SQLite 上 执行 一 个 query 的 一 般 过 程 。 
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#include<stdio.h> 
#include<stdlib.h> 
#include"sqlite3.h" 
#include<string.h> 
#pragma comment(lib, "sqlite3.1lib") 
int main(int argc,char **argv) 
{ 
int rc,i,ncols; 
sqlite3 *db; 
sqlite3_stmt *stmt; 
char *sql; 
const char*tail; 
// 打 开 数 据 
rc=sqlite3_open("foods.db", &db); 
if(rc){ 
fprintf(stderr, "Can'topendatabase:%sn",sqlite3_errmsg(db) ); 
sqlite3_close(db); 
exit(1); 


sql="select * from episodes"; 
// 预 处 理 
rc=sqlite3_prepare(db, sql, (int)strlen(sql),&stmt, &tail); 
if (rc!=SQLITE_OK) { 

fprintf(stderr, "SQLerror:%sn",sqlite3_errmsg(db) ); 


rc=sqlite3_step(stmt); 
ncols-sqlite3 column count(stmt); 
while(rc==SQLITE_ROW) { 
for (i=0;i<ncols;i++){ 
fprintf(stderr, "'%s'",sqlite3_column_text(stmt,i)); 
} 


fprintf(stderr,"\n"); 
rc=sqlite3_step(stmt); 
} 
/ /*&3Xstatement 
sqlite3_finalize(stmt); 
// 关 闭 数据 库 
sqlite3_close(db); 
printf("\n"); 
return(0); 


上 述 代码 在 VC6++ 下 调试 通过 ， 其 步骤 为 : 
将 上 述 代码 做 成 一 个 .cpp 文 件 并 为 它 创 建 工作 空间 。 


将 sqlite3.def 和 sqlite3.dll 文 件 复制 到 工作 空间 所 在 目录 。( 这 两 个 文件 可 由 sqlitedll-3_6_18.zip 
文件 解压 而 得 ) 


进入 DOS 命 令 行 状态 ， 进 入 工作 空间 所 在 目录 ， 执 行 如 下 3 条 命令 : 


PATH = D:\Program Files\Microsoft Visual Studio 9.0\VC\bin;%PATH% 
PATH = D:\Program Files\Microsoft Visual Studio 9.0\Common7\IDE;%PATH% 
LIB /DEF:sqlite3.def /machine: 1X86 


È: 上 述 命令 用 于 制作 .lib 文 件 ， 用 于 项 目的 链接 。 如 果 PATH 已 经 设 好 ， 前 两 条 命令 可 能 不 需 
要 执行 ; 如 果 执行 ， 可 能 需要 根据 VC 的 安装 情况 有 所 改动 。 


临时 存储 器 : 


临时 存储 器 是 查询 处 理 的 重要 组 成 部 分 。SQLite 有 时 需要 存储 命令 执行 过 程 中 产生 的 中 间 结 
果 一 如 结果 集 由 ORDER BY 子 句 指定 需要 排序 ， 或 进行 多 表 交 又 查询 时 。 中 间 结 果 存 储 在 
临时 存储 器 中 。 临 时 存储 器 或 者 在 内 存 ， 或 者 在 文件 中 。 


使 用 参数 化 的 SQL 


SQL 语句 可 以 包含 参数 。 参 数 是 SQL 命令 中 的 占 位 符 ， 它 们 的 值 会 在 编译 之 后 提供 ( 称 为 " 绑 
定 9。 下 面 是 带 参 数 的 SQL 示例 语句 : 


INSERT INTO foods (id, name) VALUES (?,?); 
INSERT INTO episodes (id, name) (:id, :name); 


上 述 语句 表现 了 参数 的 两 种 绑 定 方式 : 按 位 置 和 按 名 称 。 第 1 条 命令 采用 了 位 置 参数 ， 第 2 条 
命令 采用 了 名 称 参数 。 


Positional parameters are defined by the position of the question mark in the statement. The 
first question mark has position 1, the second 2, and so on. Named parameters use actual 
variable names, which are prefixed with a colon. When sqlite3_prepare() compiles a 
statement with parameters, it allocates placeholders for the parameters in the resulting 
statement handle. It then expects values to be provided for these parameters before the 
statement is 


executed. #¢ RR LAA BRS A> I JATT ^ SQLite 默认 为 各 参数 赋 NULL 值 。 


使 用 参数 绑 定 的 好 处 是 你 可 以 多 次 执行 相同 的 语句 而 不 必 重 新 编译 它们 。You just reset the 
statement, bind a new set of values, and reexecute. This is where resetting rather than 
finalizing a statement comes in handy: it avoids the overhead of SQL compilation. By 
resetting a statement, you are reusing the compiled SQL code. You completely avoid the 
tokenizing, parsing, and code generation overhead. Resetting a statement is implemented in 
the API by the sqlite3_reset() function. 


使 用 参数 的 另 一 个 好 处 是 : SQLite 可 以 对 你 绑 定 到 参数 的 字符 串 值 做 一 定 的 处 理 。 例 如 ， 有 
一 个 参数 值 Kenny's Chicken'， 参 数 绑 定 过 程 会 自动 地 将 其 转化 为 Kenny"s Chicken'。 下 面 的 
擅 代 码 说 明了 绑 定 参数 的 基本 方法 : 


db = open('foods.db' ) 

stmt = db.prepare('INSERT INTO episodes (id, name) VALUES (:id, :name)') 
stmt.bind('id', '1') 
stmt.bind('name', 'Soup Nazi') 
stmt.step() 

# Reset and use again 

stmt.reset() 

stmt.bind('id', '2') 
stmt.bind('name', 'The Junior Mint') 
# Done 

stmt.finalize() 

db.close() 


执行 封装 的 Query 


如 前 文 所 述 ， 有 两 个 很 有 用 的 函数 可 以 封装 查询 的 预 编译 过 程 ， 允 许 你 在 单一 的 函数 调用 中 
执行 SQL 命令 。 一 个 函数 是 sqlite3_exec()， 特 别 适合 执行 不 需要 返回 数据 的 查询 。 另 一 个 是 
sqlite3_get table()， 返 回 一 个 表格 化 的 结果 集 。In many language extensions you will see 
analogs to both functions. Most extensions refer to the first method simply as exec(), and the 
second as just get_table(). 


sqlite3_get_table() 的 元 数 名 起 得 不 太 合 适 ， 听 起 来 好 象 是 要 返回 一 个 表 的 全 部 数据 。 其 实 它 
的 命名 只 是 表示 将 会 返回 一 个 表格 化 的 结果 集 。 


db = open('foods.db') 
table = db.get table("SELECT * FROM episodes LIMIT 10") 
for i=0; i < table.rows; i++ 

for j=0; j < table.cols; j++ 

print table[i][j] 

end 
end 
db.close() 


错误 处 理 


前 面 的 例子 都 是 极度 简化 了 的 ， 只 关注 查询 的 执行 。 而 在 实际 情况 下 ， 你 总 得 关注 出 错 的 可 
能 性 。 你 前 面 所 看 到 的 几乎 每 个 函数 在 某 些 情况 下 都 可 能 引发 错误 。 通 常 你 需要 对 错误 代码 
SQLITE_ERROR、SQLITE_ BUSY 和 SQLITE_ SCHEMA3t £T4b 3€ » SQLITE BUSY 在 当前 连 
接 不 能 够 获得 一 个 锁 时 触发 ，SQLITE_SCHEMA 在 语句 的 编译 与 执行 之 间 schema 发 生 了 改变 
时 触发 。“ 忙 ”状态 将 在 本 章 的 事务 一 节 中 介绍 。Schema 错 误 将 在 第 6 章 介 绍 。 


很 多 语言 扩展 难于 处 理 sSchema 错 误 。 有 些 透 明 地 报告 处 于 忙 状态 ， 有 些 直 接 返 回 实 际 的 错误 
代码 。 无 论 如 何 ， 如 果 你 遇 到 了 schema 和 错误， 表示 有 其 它 的 连接 在 你 的 读 与 写 之 间 改 变 了 数 
据 库 ， 你 的 语句 已 不 再 合法 。 你 需要 重新 编译 语句 ， 以 便 能 够 重新 执行 它 。Schema 错 误 只 会 
发 生 在 对 prepare() 的 调用 和 第 1 次 对 step() 的 调用 之 间 。 如 果 你 的 第 1 次 step() 调 用 成 功 ， 那 你 
就 不 必 再 担心 在 后 面 调 用 step() 时 会 引发 Schema 错误 了 ， 因 为 你 的 连接 已 经 锁 住 了 数据 库 ， 
其 它 的 连接 不 可 能 在 此 期 间 修 改 数据 库 。 

对 于 一 般 性 错误 ，API 提 供 了 sqlite3_errcode() 来 获取 最 后 一 次 调用 API 亟 数 时 的 返回 码 。 你 可 
以 使 用 sqlite3_errmsg() 有 函数 得 到 更 具体 的 错误 信息 ， 该 函数 提供 了 对 最 后 错误 的 文字 描述 ， 
大 多 数 语 言 扩 展 都 支持 这 个 函数 。 


有 了 这 个 观念 ， 前 面 例子 中 的 每 个 调用 都 可 以 用 类 似 下 面 的 代码 来 检查 错误 : 


# Check and report errors 

if db.errcode() != SQLITE_OK 
print db.errmsg(stmt) 

end 


一 般 情况 下 ， 错 误 处 理 并 不 困难 。 处 理 错误 的 方法 由 你 确切 地 想 要 做 什么 决定 。 


T ASESQLi€ 4) 


另 一 个 方便 的 函数 是 sqlite3_mprintf()， 它 是 标准 C 库 函数 sprintf() 的 一 个 变 体 。 它 有 很 独特 的 
替换 符 ， 特 别 方便 对 SQL 进行 处 理 。 它 的 替换 符 是 %q 和 %Q 。%q 的 工作 原理 像 %s， 从 参数 

列表 中 取得 一 个 以 NULL 结 束 的 字符 囊 。 它 会 将 单 引号 反 儿 杠 都 双 写 ， 使 你 更 容易 防范 SQL 注 
入 式 攻击 ( 参 本 节 下 文 的 "SQL 注 入 式 攻击 "一段 )。 例 如 : 


char* before = "Hey, at least %q no pig-man."; 
char* after = sqlite3_mprintf(before, "\he's\"); 


上 述 程序 执行 后 after 的 值 为 'Hey, at least \ne"s\ no pig-man' ° The single quote in he’s is 
doubled along with the backslashes around it, making it acceptable as a string literal in a 
SQL statement. The %Q formatting does everything %qdoes, but it additionally encloses the 
resulting string in single quotes. Furthermore, if the argument for %Q is a NULL pointer (in 
C), it produces the string NULL without single quotes. For more information, see the 

sglite3 mprintf() documentation in the C API reference in Appendix B. 


SQL 注入 式 攻 击 : 


如 果 你 的 应 用 程序 依赖 用 户 的 输入 来 构造 SQL 语句 ， 那 么 它 将 很 容易 受到 SQL 注入 攻击 。 如 
果 你 没有 精心 地 过 滤 用 户 输入 ， 有 人 可 能 会 输入 别有用心 的 内 容 ， 注 入 到 你 的 SQL 中 ， 并 在 
其 后 面 构成 一 个 新 的 SQL 语 句 。 例 如 ， 你 的 程序 用 用 户 输 入 来 卉 充 下 面 SQL 语 句 : 


SELECT * FROM foods WHERE name='%s'; 


如 果 无 论 用 户 输入 什么 都 直接 来 蔡 换 %s， 如 果 用 户 对 你 的 数据 库 有 一 定 了 解 ， 他 可 以 输入 如 
FAS: 


nothing' LIMIT 0; SELECT name FROM sqlite_master WHERE name='% 


将 用 户 输入 替换 进 原 有 的 SQL 语句 之 后 ， 变 成 了 两 个 新 的 语句 : 


SELECT * FROM foods WHERE name-'nothing' LIMIT 0; SELECT name FROM 
sqglite master WHERE name='%'; 


第 1 个 语句 什么 都 不 返回 ， 但 第 2 个 将 返回 表 中 所 有 的 记录 。Granted, the odds of this 
happening require quite a bit of knowledge on the attacker’s part, but it is nevertheless 
possible. Some major (commercial) web applications have been known to keep SQL 
statements embedded in their JavaScript, which can provide plenty of hints about the 
database being used. In the previous example, all a malicious user has to do now is insert 
DROP TABLE statements for every table found in sqlite_master and you could find yourself 
fumbling through backups. 


操作 控制 


APl 中 包含 几 个 命令 来 监视 、 控 制 ， 或 者 说 限制 数据 库 操作 。SQLite 使 用 过 滤 ( 或 称 回 叫 ) 函 

来 完成 此 功能 ， 你 可 以 注册 它们 由 特定 的 事件 来 调用 。 有 3 个 “hook" 子 数 : 

sqlite3 commit _ hook()， 它 监视 事务 的 提交 : sqlite3_rollback hooro; ， 它 监视 事务 的 回 卷 ; 
sqlite3_update_hook()， 它 监视 INSERT、UPDATE 和 DELETE 操 作 。 这 些 函 数 在 运行 时 被 调 
用 一 一 即 当 命令 执行 时 被 调用 。Each hook allows you to register a callback function on a 
connection-by-connection basis, and lets you provide some kind of application-specific data 
to be passed to the callback as well. The general use of operational control functions is as 
follows: 


def commit_hook(cnx) 
log('Attempted commit on connection %x', cnx) 
return -1 
end 
db = open('foods.db' ) 
db.set_commit_hook(rollback_hook, cnx) 
db.exec("BEGIN; DELETE from episodes; ROLLBACK") 
db.close() 


使 用 线程 

SQLite 有 几 个 可 以 在 多 线程 环境 下 使 用 的 函数 。 在 3.3.1 版 中 ，SQLite 引 入 了 一 种 称 为 共享 组 
冲 区 模式 的 独特 的 操作 模式 ， 就 是 为 多 线程 的 内 上 散 式 服务 器 设计 的 。 这 个 模式 提供 了 一 种 用 
PARTERRE 车 接 的 方法 ， 可 以 共 E UG NL Ane 和 个 服务 器 的 内 存 需 
求 。 这 个 模式 包括 多 个 函数 来 管理 内 存 和 服务 器 。 详 见 第 6 章 “ 共 享 缓冲 区 模式 "一 节 。 
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它 对 应 于 你 用 C 语 言 或 其 它 语言 实现 的 函数 的 句柄 。 使 用 C API 时 ， 这 些 句 柄 用 C/C++ 实现 。 


用 户 定义 的 扩展 必须 注册 到 一 个 由 连接 到 连接 的 基础 (connection-by-connection basis) 之 上 ， 
存储 在 程序 内 存 中 。 也 就 是 说 ， 它 们 不 是 存储 在 数据 库 中 (就 像 大 型 数据 库 的 存储 过 程 一 样 )， 
而 是 存储 在 你 的 程序 中 。 


创建 用 户 自 定义 函数 


实现 一 个 用 户 自 定义 的 郊 数 分 为 两 步 。 首 先 ， 写 句柄 。 和 句柄 实现 一 些 你 想 通过 SQL 完 成 的 功 
能 。 然 后 ， 注 册 句 柄 ， 为 它 提供 SQL 名 称 、 参 数 的 数量 和 一 个 指向 句柄 的 指针 。 


例如 ， 你 想 创建 一 个 叫做 hello howman) S SOLA ， 它 返回 文本 'Hello Jerry' » # SQLite C 
API 中 ， 先 创建 一 个 C 函 数 来 实现 此 功能 ， 如 


void hello_newman(sqlite3_context* ctx, int nargs, sqlite3_value** values) 
t 

/* Create Newman's reply */ 

const char *msg - "Hello Jerry"; 


/* Set the return value. Have sqlite clean up msg w/ sqlite free(). */ 
sglite3 result text(ctx, msg, strlen(msg), sqlite3 free); 


不 了 解 C 和 C APl 也 没关系 。 这 个 句柄 仅 返 回 'Hello Jerry'。 下 面 是 实际 使 用 它 。 使 用 
sglite3 create function() i Zt 7x At 3x 4 4) 458 : 


sglite3 create function(db, "hello newman", ©, hello newman); 


第 1 个 参数 (db) 是 数据 库 连 接 。 第 2 个 参数 是 函数 的 名 称 ， 这 个 名 称 将 出 现在 SQL 中 。 第 3 个 参 
数 表示 这 个 函数 有 0 个 参数 (如 果 该 参数 值 为 -1， 表 示 该 函数 接受 可 变数 量 的 参数 )。 最 后 一 个 
参数 是 C 函 数 hello_newman() 的 指针 ， 当 SQL 函数 被 调用 时 ， 通 过 这 个 指针 来 调用 实际 的 函 
数 。 


一 旦 进行 了 注册 ，SQLite 就 知道 了 当 遇 到 SQL 函数 调用 hello_newman() 时 ， 它 需要 调用 C 有 函数 
hello_newman() 来 得 到 结果 。 现 在 ， 你 可 以 在 程序 中 执行 SELECT hello_newman()ié 4 > € 

将 返回 单行 单列 的 文本 'Hello Jerry' 。 

如 前 所 述 ， 很 多 语言 扩展 允许 用 各 自 的 语言 来 实现 用 户 自 定义 的 函数 。 例 如 ，Java、Perl 等 。 
不 同 的 语言 扩展 用 不 同 的 方法 注册 函数， 有 些 使 用 其 本 身 语 言 的 函数 来 完成 此 项 工作 ， 例 

如 ， 在 Ruby 中 使 用 block 一 one ° 


创建 用 户 自 定 义 聚 合 
所 谓 聚合 函数 ， 就 是 那些 在 结果 集中 应 用 于 全 部 记录 ， 并 从 中 计算 一 些 聚合 值 的 函数 。 
SUM()、COUNT() 和 AVG() 都 是 SQLite 标 准 聚 合 函 数 的 例子 。 


创建 用 户 自 定义 聚合 需要 三 步 ; 注册 聚合 、 实 现 步 进 耳 数 (对 结果 集中 的 每 条 记录 调用 )、 实 现 
定案 函数 (在 所 有 记录 处 理 完 后 调用 )。 在 定案 函数 中 计算 最 终 的 聚合 值 ， 并 做 一 些 必要 的 清理 
LH 


创建 用 户 自 定义 排序 法 


事务 


现在 ， 你 应 该 已 经 对 API 有 了 一 个 较 好 的 了 解 。 你 知道 了 执行 SQL 命令 的 不 同方 法 和 一 些 有 用 
的 功能 函数 。 但 是 ， 只 知道 API 还 不 够 ， 事 务 和 锁 与 查询 的 处 理 过 程 是 紧密 关联 的 。 查 询 永远 
只 能 在 事务 中 完成 ， 事 务 包含 锁 ， 而 如 果 不 清楚 自己 到 底 在 做 什么 ， 锁 则 可 能 会 导致 问题 。 
根据 你 是 如 何 使 用 SQL 及 如 何 编码 ， 你 可 以 控制 锁 的 类 型 和 持续 时 间 。 


第 4 章 图 示 了 一 个 特殊 的 假想 : 两 个 独立 的 连接 同时 执行 时 导致 了 死 锁 。 作 为 程序 员 ， 你 还 可 
以 从 代码 的 角度 来 看 待 问题 ， 代 码 中 可 能 包括 处 于 多 种 状态 的 多 个 连接 ， 带 有 多 个 语句 句 

柄 ， 而 你 的 代码 可 能 在 你 不 知情 的 情况 下 就 持 有 了 EXCLUSIVE 锁 ， 从 而 使 其 它 连接 不 能 做 任 
何事 情 。 


这 就 是 为 什么 掌握 下 面 知 识 很 重要 : 事务 和 锁 如 何 工 作 ， 它 们 如 何 与 API 结 合 来 处 理 查询 。 理 
想 的 目标 是 ， 你 应 该 能 够 看 着 你 写 的 代码 并 说 出 事务 处 于 什么 状态 ， 或 者 至 少 能 够 发 现 潜在 
的 问题 。 本 节 将 介绍 事务 和 锁 背 后 的 运行 机 制 ， 下 一 节 将 介绍 如 何 实际 地 编码 。 


事务 的 生命 周期 


有 一 些 关于 代码 和 事务 的 问题 需要 关注 。 首 先 需 要 知道 哪个 对 象 运行 在 哪个 事务 之 下 。 另 一 
个 问题 是 持续 时 间 一 ”一 个 事务 何 时 开始 ， 何 时 结束 ， 从 哪 一 点 开始 影响 其 它 连 接 ? 第 一 个 
问题 与 API 直 接 关 联 ， 第 二 个 与 SQL 的 一 般 概 念 及 SQLite 的 特殊 实现 关联 。 


一 个 连接 (connection) 可 以 包含 多 个 语句 (statement)， 而 且 每 个 连接 有 一 个 与 数据 库 关联 的 B- 
tree 和 一 个 pager。Pager 在 连接 中 起 着 很 重要 的 作用 ， 因 为 它 管理 事务 、 锁 、 内 存 缓冲 以 及 

ft 3 AA iit Pe X (crash recovery)。 当 你 进行 数据 库 写 操作 时 ， 记 住 最 重要 的 一 件 事 : 在 任何 时 
候 ， 只 在 一 个 事务 下 执行 一 个 连接 。 这 回答 了 第 一 个 问题 。 


关于 第 二 个 问题 ， 一 般 来 说 ， 一 个 事务 的 生命 周期 和 语句 差不多 ， 你 也 可 以 手动 结束 它 。 默 
认 情 况 下 ， 事 务 自动 提交 ， 当 然 你 也 可 以 通过 BEGIN..COMMIT 手 动 提交 。 接 下 来 的 问题 是 事 
务 如 何 与 锁 关联 。 


锁 的 状态 


大 多 数 情况 下 ， 锁 的 生命 周期 在 事务 的 生命 周期 之 中 。 它 们 不 一 定 同时 开始 ， 但 总 时 同时 结 
束 。 当 你 结束 一 个 事务 时 ， 也 会 释放 它 相 关 的 锁 。 或 者 说 ， 锁 直到 事务 结束 或 系统 崩 演 时 才 
会 释放 。 如 果 系 统 在 事务 没有 结束 的 情况 下 崩溃 ， 那 么 下 一 个 访问 数据 库 的 连接 会 处 理 这 种 
情况 ， 详 见 “ 锁 与 前 演 恢 复 "一 节 。 


在 SQLite 中 有 5 种 不 同 的 锁 状 态 ， 连 接 (connection) 任 何 时 候 都 处 于 其 中 的 一 个 状态 。 图 5-3 显 
示 了 锁 的 状态 以 及 状态 的 转换 。 
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图 5-3 SQLite 锁 转换 
关于 这 个 图 有 以 下 几 点 值得 注意 : 


(1) 一 个 事务 可 以 在 UNLOCKED、RESERVED 或 EXCLUSIVE 三 种 状态 下 开始 。 默 认 情 况 下 在 
UNLOCKED 时 开始 。 


(2) 白 色 框 中 的 UNLOCKED、PENDING、SHARED 和 RESERVED 可 以 在 一 个 数据 库 的 同一 
时 刻 存在 。 


(3) 从 灰色 的 PENDING 开 始 ， 事 情 就 变 得 严格 起 来 ， 意 味 着 事务 想得到 排 它 锁 (EXCLUSIVE) 
(注意 与 白色 框 中 的 区 别 )。 


虽然 锁 有 这 么 多 状态 ， 但 是 从 体质 上 来 说 ， 只 有 两 种 情况 : 读 事务 和 写 事务 。 


读 事务 


我 们 先 来 看 看 SELECT 语句 执行 时 锁 的 状态 变化 过 程 ， 非 常 简单 : 一 个 连接 执行 SELECT 语 
4] > fA —/+ SES > JLUNLOCKED2 SHARED ， 当 事务 COMMIT 时 ， 又 回 到 UNLOCKED ， 
就 这 么 简单 。 


那么 ， 当 你 运行 两 个 语句 时 会 发 生 什么 呢 ? 这 时 如 何 加 锁 呢 ? 这 依赖 于 你 是 否 运行 在 自动 提 
交 状 态 。 考 虑 下 面 的 例子 (为 了 简单 ， 这 里 用 了 伪 码 ) : 


db = open('foods.db' ) 
db.exec('BEGIN') 

db.exec('SELECT * FROM episodes!) 
db.exec('SELECT * FROM episodes!) 
db.exec('COMMIT') 

db.close() 


由 于 显 式 地 使 用 了 BEGIN 和 COMMIT， 两 个 SELECT 命令 在 一 个 事务 下 执行 。 第 一 个 exec() 执 
行 时 ， 连 接 处 于 SHARED， 然 后 第 二 个 exec() 执 行 。 当 事务 提交 时 ， 连 接 又 从 SHARED 回 到 
UNLOCKED 状 态 ， 状 态 变化 如 下 : 


UNLOCKED-PENDING-SHARED-UNLOCKED 


如 果 没 有 BEGIN 和 COMMIT 两 行 ， 两 个 SELECT 都 运行 于 自动 提交 状态 ， 状 态 变 化 如 下 : 


UNLOCKED-PENDING-SHARED-UNLOCKED-PENDING-SHARED-UNLOCKED 


仅仅 是 读数 据 ， 但 在 自动 提交 模式 下 ， 却 会 经 历 两 个 加 解锁 的 循环 ， 太 麻烦 。 而 有 全， 一 个 写 
进程 可 能 插 到 两 个 SELECT 中 间 对 数据 库 进 行 修改 ， 这 样 ， 你 就 不 能 保证 第 二 次 能 够 读 到 同样 
的 数据 了 ， 而 使 用 BEGIN..COMMIT 就 可 以 有 此 保证 。 


写 事务 


下 面 我 们 来 考虑 写 数 据 库 ， 比 如 UPDATE。 和 读 事务 一 样 ， 它 也 会 经 历 
UNLOCKED—PENDING-SHARED/4] 4 4b 3t > 4& J& TF 3 3l 2 7 $IPENDING AJ Æ He 45| e 8] 
关口 作用 的 了 。 


保留 (RESERVED) 状 态 


当 一 个 连接 (connection) 要 向 数据 库 写 数据 时 ， 从 SHARED 状 态 变 为 RESERVED 状 态 。 如 果 
它 得 到 RESERVED 锁 ， 也 就 意味 着 它 已 经 准备 好 进行 写 操作 了 。 即 使 它 没有 把 修改 写 入 数据 
库 ， 也 可 以 把 修改 保存 到 位 于 pager 的 缓冲 区 中 (page cache) 了 。 


当 一 个 连接 进入 RESERVED 状 态 ，pager 就 开始 初始 化 回 卷 日 志 (rollback journal)。 回 卷 日 志 
是 一 个 文件 ， 用 于 回 卷 和 前 溃 恢 复 ， 见 图 5-1。 在 RESERVED 状 态 下 ，pager 管 理 着 三 种 页 : 


(1) 已 修改 的 页 : 包含 被 B-tree 修 改 的 记录 ， 位 于 page cache 中 。 


(2) 未 修改 的 页 : 包含 没有 被 B-tree 修 改 的 记录 。 


(3) 日 志 页 : 这 是 修改 页 以 前 的 版 本 ， 日 志 页 并 不 存储 在 page cache 中 ， 而 是 在 B-tree 修 改 页 
之 前 写 入 日 志 。 


Page cache 非 常 重要 ， 正 是 因为 它 的 存在 ， 一 个 处 于 RESERVED 状 态 的 连接 可 以 丨 正 的 开始 
工作 ， 而 不 会 干扰 其 它 的 ( 读 ) 连 接 。 所 以 ，SQLite 可 以 高 效 地 处 理 在 同一 时 刻 的 多 个 读 连 接 和 
一 个 写 连接 。 


未 决 (PENDING) 状 态 


当 一 个 连接 完成 修改 ， 需 要 旦 正 开始 提交 事务 时 ， 执 行 该 过 程 的 pager 进 入 EXCLUSIVE 状 
态 。 从 RESERVED 状 态 开 始 ，pager 试 着 获取 PENDING 锁 ， 一 旦 得 到 ， 就 独占 它 ， 不 允许 任 
何其 它 连接 获得 PENDING 锁 。 既 然 写 操作 持 有 PENDING 锁 ， 其 它 任何 连接 都 不 能 从 
UNLOCKED 状 态 进 入 SHARED 状 态 ， 即 不 会 再 有 新 的 读 进程 ， 也 不 会 再 有 新 的 写 进程 。 只 
那些 已 经 处 于 SHARED 状 态 的 连接 可 以 继续 工作 。 而 处 于 PENDING 状 态 的 写 进 程 会 一 直 等 到 
所 有 这 些 连 接 释放 它们 的 锁 ， 然 后 对 数据 库 加 EXCUSIVE 锁 ， 进 入 EXCLUSIVE 状 态 ， 独 占 数 
据 库 。 


排 它 状态 


在 EXCLUSIVE 状 态 下 ， 主 要 的 工作 是 把 修改 的 页 从 page cache 写 入 数据 库 文件 ， 这 是 丨 正 进 
行 写 操作 的 地 方 。 


在 pager 将 修改 页 写 到 文件 之 前 ， 还 必须 先 处 理 日 志 。 它 检查 是 否 所 有 的 日 志 都 写 入 了 磁盘 ， 
为 它们 可 能 还 位 于 操作 系统 的 缓冲 区 中 。 所 以 pager 得 告诉 OS 把 所 有 的 文件 写 入 磁盘 ， 这 
与 synchronous pragma 所 做 的 工作 相同 ， 如 第 4 章 所 述 。 


日 志 是 数据 库 进行 恢复 的 惟一 方法 ， 所 以 日 志 对 于 DBMS 非 常 重要 。 如 果 日 志 页 没有 完全 写 入 
磁盘 而 发 生 崩 演 ， 数 据 库 就 不 能 恢复 到 它 原来 的 状态 ， 此 时 数据 库 就 处 于 不 一 致 状态 。 日 志 
写 盘 完成 后 ，pager 就 把 所 有 的 修改 页 写 入 数据 库 文件 。 接 下 来 做 什么 取决 于 事务 提交 的 模 
式 ， 如 果 是 自动 提交 ， 那 么 pager 清 理 日 志 、page cache， 然 后 由 EXCLUSIVE 进 入 
UNLOCKED。 如 果 是 手动 提交 ， 那 么 pager 继 续 持 有 EXCLUSIVE 锁 和 回 卷 日 志 ， 直 至 遇 到 
COMMIT #ROLLBACK ° 


总 之 ， 出 于 性 能 方面 的 考虑 ， 进 程 占 有 排 它 锁 的 时 间 应 该 尽 可 能 的 短 ， 所 以 DBMS 通 常 都 是 在 
贤 正 写 文件 时 才 会 占有 排 它 锁 ， 这 样 能 大 大 提高 并 发 性 能 。 


自动 提交 与 效率 


WE E pr 


回 到 前 面 的 例子 ， 事 务 从 BEGIN 开 始 ， 跟 着 UPDATE“。 如 果 在 写 盘 之 前 ， 修 改 操作 将 缓冲 区 
用 完了 (也 就 是 说 修改 操作 需要 比 预 设 的 更 多 的 缓冲 区 )， 这 时 会 发 生 什 么 呢 ? 


转换 为 排 它 


EGER PAS : 到 底 在 哪个 (精确 的 ) 时 刻 ， 到 底 为 什么 ，pager 从 RESERVED 转 换 为 
EXCLUSIVE 。 这 会 发 生 在 两 种 情况 下 : 当 连 接 到 达 提 交点 主动 进入 排 它 状态 ; 或 页 缓冲 区 已 
满 不 得 不 进入 排 它 状态 。 


前 面 我 们 仅 看 到 了 第 1 种 情况 ， 那 么 ， 在 第 2 种 情况 下 会 发 生 什 么 呢 ? 此 时 pager 已 不 能 再 存储 
更 多 的 已 修改 页 ， 也 就 不 能 再 做 任何 修改 操作 。 它 必须 转换 为 排 它 状 态 ， 以 使 工作 能 够 继续 
进行 。 实 际 上 也 不 完全 是 这 样 ， 实 际 上 有 软 限制 和 硬 限制 的 区 别 。 


调整 页 缓冲 区 的 大 小 


如 何 决定 需要 多 大 的 缓冲 区 尺寸 呢 ? 这 由 你 想 做 什么 而 定 。 假 设 你 想 修改 episodes 表 的 所 有 
记录 ， 那 么 该 表 的 所 有 页 都 会 被 修改 ， 因 此 ， 你 就 可 以 计算 出 episodes 表 总 共 需 要 多 少 个 页 
并 对 缓冲 区 做 出 调整 。 可 以 用 sqlite_analyzer 到 得 所 有 关于 episodes 表 的 需要 的 信息 。 对 每 一 
个 表 ， 它 都 可 以 做 出 完备 的 统计 ， 包 括 总 页 数 。 例 如 ， 对 于 foods 数 据 库 ， 可 以 得 到 关于 
episodes 表 的 如 下 信息 : 


kkk Table EPISODES kk ck cock ck ck ck ck ck ck ck kk KE KKK KEK KKK KEK ke ke ke ck ck ke Sk ck ko ko ck ck ko ko ko ko ko ko ko ko ko ko ko 


Percentage of total database.......... 20.096 
Nümberdco m EenbIPresr me PME 181 

Bytes of storage consumed............. 5120 

Bytes of payload e TTE 3229 63.196 
Average payload per entry............. 17.84 
Average unused bytes per entry........ 5.79 
Average kano eee seme eters D SES 4.00 
Maximum payload per entry............. 38 

Entries that use overflow............. 0 0.0% 
Dndexepadessusedc e me TI SE Dues 1 

Primary pages used..... e e 4 

Overflow pages used........... isses 0 
Tótalspages usedi eere TEL EE 5 

Unused bytes on index pages........... 990 96.7% 
Unused bytes on primary pages......... 58 1.4% 
Unused bytes on overflow pages........ 0 

Unused bytes on all pages............. 1048 20.596 


总 页 数 是 5， 但 实际 上 表 只 用 了 4 页 ， 还 有 1 页 是 索引 。 因 为 默认 的 缓冲 区 大 小 是 2000 个 页 ， 所 
以 你 没有 必要 担心 。 在 episodes 表 中 有 400 条 记录 ， 也 就 是 说 每 页 可 存放 约 100 条 记录 。 所 
以 ， 在 修改 所 有 记录 之 前 你 不 需要 考虑 调整 页 缓冲 区 ， 除 非 episodes 中 至 少 有 了 196000 条 记 
录 。 还 要 记 住 ， 你 只 需要 在 有 其 它 连 接 并 发 使 用 数据 库 的 情况 下 才 需 要 考虑 这 些 ， 如 果 只 有 
你 自己 使 用 数据 库 ， 这 些 就 都 不 需要 考虑 了 。 


我 们 前 面谈 到 过 pager 等 待 从 PENDING 状 态 进入 EXCLUSIVE 状 态 ， 那 么 在 这 个 期 间 到 底 发 生 
THAR? 首先 ， 任 何 exec() 或 step() 的 调用 都 可 能 进入 等 待 。 当 SQLite 遇 到 不 能 获得 锁 的 情 
况 时 ， 它 的 默认 表现 总 是 向 函数 返回 一 个 SQLITE_BUSY 并 使 函数 继续 寻求 锁 。 无 论 你 执行 什 
么 命令 ， 都 有 可 能 遇 到 SQLITE_BUSY， 包 括 SELECT 命 令 ， 都 有 可 能 因为 有 其 它 的 写 进程 处 
于 未 决 状态 而 遇 到 SQLITE_BUSY。 当 遇 到 SQLITE_BUSY 时 ， 最 简单 的 选择 是 重 试 。 但 是 ， 
下 面 我 们 就 会 看 到 这 并 不 一 定 是 最 好 的 选择 。 


AR JI] ^p" 6] 8 
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或 做 其 它 任何 事情 一 de 25 A e X — 34 OB HE?) » "C BUE SQLite FAG 3k A15 AA A] 9 PÈ 6138 
必须 做 的 唯一 的 事 是 返回 一 个 值 ， 告诉 SQLite 下 一 步 该 做 什么 。 如 果 它 返回 TRUE，SQLite 将 
会 继续 尝试 获得 锁 ; 如 果 它 返回 FALSE，SQLite 将 向 申请 锁 的 函数 返回 SQLITE_BUSY。 看 
下 面 的 例子 : 


counter = 1 
def busy() 
counter = counter + 1 
if counter == 2 
return 0 
end 
spam_mother_in_law(100) 
return 1 
end 
db.busy handler(busy) 
stmt = db.prepare('SELECT * FROM episodes; ') 
stmt.step() 
stmt.finalize() 


spam_mother_in_law() 完 成 一 个 发 邮件 功能 。 


step() 函 数 必 须 获 得 一 个 SHARED 锁 以 完成 SELECT 操作 。 如 果 此 时 有 一 个 写 进程 活动 ， 正 党 
情况 下 step() 会 返回 SQLITE_BUSY 。 但 是 ， 在 上 面 程序 中 却 不 是 这 样 ， 而 是 由 pager 调 用 
busy() 84% » AAG GARE MAME 4) 48 © busy) f C3 Ze TE ak > OUR HA RF OPH > HA 
返回 1， 在 pager 中 会 被 翻译 成 true 一 继续 申请 锁 。Pager 再 次 申请 获得 SHARED 锁 ， 但 数据 
库 仍然 被 锁 着 ， 于 是 pager 再 次 调用 busy() 元 数 。 只 有 此 时 ，busy() 元 数 返 回 0， 在 pager 中 会 
被 翻译 成 false 一 返回 SQLITE BUSY ° 





使 用 正确 的 事务 


编码 


现在 ， 你 对 API、 事 务 和 锁 已 经 有 了 很 好 的 了 解 了 。 最 后 ， 我 们 把 这 3 个 内 容 在 代码 中 结合 到 
一 起 o 


使 用 多 个 连接 


如 果 你 曾经 为 其 它 的 关系 型 数据 库 编 写 过 程序 ， 你 就 会 发 现 有 些 适 用 于 那些 数据 库 的 方法 不 
一 定 适用 于 SQLite。 使 用 其 它 数据 库 时 ， 经 常会 在 同一 个 代码 块 中 打开 多 个 连接 ， 典 型 的 例 
子 就 是 在 一 个 连接 中 返 复 遍历 一 个 表 而 在 另 一 个 连接 中 修改 它 的 记录 。 


在 SQLite 中 ， 在 同一 个 代码 块 中 使 用 多 个 连接 会 引起 问题 ， 必 须 小 心地 对 待 这 种 情况 。 请 看 
下 面 代码 : 


c1 = open('foods.db') 

c2 - open('foods.db') 

stmt = ci.prepare('SELECT * FROM episodes') 

while stmt.step() 
print stmt.column('name') 
C2.exec('UPDATE episodes SET ..) 

end 

stmt.finalize() 

c1.close() 

c2.close() 


问题 很 明显 ， 当 c2 试 图 执行 UPDATE 时 ，c1 拥 有 一 个 SHARED 锁 ， 这 个 锁 只 有 等 
stmt.finalize() 之 后 才 会 释放 。 所 以 ， 是 不 可 能 成 功 写 数 据 库 的 。 最 好 的 办 法 是 在 一 个 连接 中 
完成 工作 ， 并 且 在 同一 个 BEGIN IMMEDIATE 事 务 中 完成 。 新 程序 如 下 : 


c1 = open('foods.db') 
# Keep trying until we get it 
while ci.exec('BEGIN IMMEDIATE') !- SQLITE OK 
end 
stmt = c1.prepare('SELECT * FROM episodes') 
while stmt.step() 
print stmt.column('name') 
ci.exec('UPDATE episodes SET ..) 
end 
stmt.finalize() 
c1.exec('COMMIT' ) 
c1.close() 


在 这 种 情况 下 ， 你 应 该 在 单独 的 连接 中 使 用 语句 (statement) 来 完成 读 和 写 ， 这 样 ， 你 就 不 必 
担心 数据 库 锁 会 引发 问题 了 。 但 是 ， 这 个 特别 的 示例 仍然 不 能 工作 。 如 果 你 在 一 个 语句 
(statement) 中 返 复 遍历 一 个 表 而 在 另 一 个 语 多 中 修改 它 的 记录 ， 还 有 一 个 附加 的 锁 问 题 你 需 
要 了 解 ， 我 们 将 在 下 面 介 绍 。 


即使 只 使 用 一 个 连接 ， 在 有 些 边 界 情况 下 也 会 出 现 问题 。 不 要 认为 一 个 连接 中 的 两 个 语句 
(statements) 就 能 协调 工作 ， 至 少 有 一 个 重要 的 例外 。 


RUIN uu om T I 
活动 的 B-tree 游 标 ， 即 使 是 本 连接 中 的 其 它 语句 也 不 能 够 再 修改 这 个 表 。 如 果 做 这 种 尝试 ， 将 
会 得 到 SQLITE_BUSY。 看 下 面 的 例子 


c = sqlite.open("foods.db") 
Stmt1 = c.compile('SELECT * FROM episodes LIMIT 10') 
while stmti.step() do 
# Try to update the row 
row = stmi.row() 
stmt2 = c.compile('UPDATE episodes SET ..') 
# Uh oh: ain't gonna happen 
stmt2.step() 
end 
stmti.finalize() 
stmt2.finalize () 
c.close() 


这 里 我 们 只 使 用 了 一 个 连接 。 但 当 调 用 stmt2.step() 则 不 会 工作 ， 因 为 stmt1 拥 有 episodes 表 的 
一 个 游标 。 在 这 种 情况 下 ，stmt2.step() 有 可 能 成 功 地 将 锁 升 级 到 EXCLUSIVE， 但 仍 会 返回 
SQLITE_BUSY， 因 为 episodes 的 游标 会 阻止 它 修 改 表 。 完 成 这 种 操作 有 两 种 方法 : 
。 遍历 一 个 语句 的 结果 集 ， 在 内 存 中 保存 需要 的 信息 。 定 案 这 个 读 语句 ， 然 后 执行 修改 操 
作 。 
© 将 SELECT 的 结果 存 到 一 个 临时 表 中 并 用 读 游标 打开 它 。 这 时 同时 有 一 个 读 语 句 和 一 个 写 
语句 ， 但 它们 在 不 同 的 表 上 ， 所 以 不 会 影响 主 表 上 的 写 操作 。 写 完成 后 ， 删 掉 临 时 表 就 
是 了 。 
当 表 上 打开 了 一 个 语句 ， 它 的 B-tree 游 标 在 两 种 情况 下 会 被 移 除 : 
e 到 达 了 语句 结果 集 的 尾部 。 这 时 step() 会 自动 地 关闭 语句 的 游标 。 从 VDBE 的 角度 ， 当 到 
达 结 果 集 的 尾部 时 ，CDBE 遇 到 Close 命 令 ， 这 将 导致 所 有 相关 游标 的 关闭 。 
e 程序 显 式 地 调用 了 finalize()， 所 有 相关 游标 将 关闭 。 


在 很 多 编程 语言 扩展 中 ，statement 对 象 的 close() 有 函数 会 自动 调用 sqlite3 _ finalize()。 


有 趣 的 临时 表 


临时 表 使 你 可 以 做 到 不 违反 规则 。 如 果 你 确实 需要 在 一 个 代码 块 中 使 用 两 个 连接 ， 或 者 使 用 
两 个 语 名 (statement) 操 作 同 一 个 表 ， 你 可 以 安全 地 在 临时 表 上 如 此 做 。 当 一 个 连接 创建 了 一 

个 临时 表 ， 不 需要 得 到 RESERVED 锁 ， 因 为 临时 表 存 在 于 数据 库 文 件 之 外 。 有 两 种 方法 可 以 
做 到 这 一 点 ， 看 你 想 如 何 管理 并 发 。 请 看 如 下 代码 : 


c1 = open('foods.db') 
c2 open('foods.db') 
C2.exec('CREATE TEMPORARY TABLE temp epsidodes as SELECT * from episodes') 
stmt = ci.prepare('SELECT * FROM episodes') 
while stmt.step() 
print stmt.column('name') 
C2.exec('UPDATE temp episodes SET ..') 


end 

stmt.finalize() 

C2.exec('BEGIN IMMEDIATE' ) 

c2.exec('DELETE FROM episodes' ) 

C2.exec('INSERT INTO episodes SELECT * FROM temp episodes') 
c2.exec('COMMIT' ) 

c1.close() 

c2.close() 


上 面 的 例子 可 以 完成 功能 ， 但 不 好 。episodes 表 中 的 数据 要 全 部 删除 并 重建 ， 这 将 丢失 
episodes 表 中 的 所 有 完整 性 约束 和 索引 。 下 面 的 方法 比较 好 : 


c1 = open('foods.db') 
c2 - open('foods.db') 
c1.exec('CREATE TEMPORARY TABLE temp episodes as SELECT * from episodes') 
stmt = ci.prepare('SELECT * FROM temp episodes') 
while stmt.step() 
print stmt.column('name') 
C2.exec('UPDATE episodes SET ..') # What about SQLITE BUSY? 
end 
stmt.finalize() 
c1.exec('DROP TABLE temp episodes') 
c1.close() 
c2.close() 


CRN ELE 


使 用 SELECT 语句 必 须要 意识 到 ， 其 SHARED 锁 (大 多 数 时 候 ) 直 到 finalize() 被 调用 后 才 会 释 
放 ， 请 看 下 面 代 码 : 


stmt = ci.prepare('SELECT * FROM episodes' ) 
while stmt.step() 
print stmt.column('name' ) 
end 
c2.exec('BEGIN IMMEDIATE; UPDATE episodes SET ..; COMMIT; ') 
stmt.finalize() 


如 果 你 用 C API 写 了 与 上 例 等 价 的 程序 ， 它 实际 上 是 no 的 。 尽 管 没有 调用 finalize()， 但 
第 二 个 连接 仍然 能 够 修改 数据 库 。 在 告诉 你 为 什么 之 前 ， 先 来 看 第 二 个 例子 : 


c1 = open('foods.db') 

c2 - open('foods.db') 

stmt = ci.prepare('SELECT * FROM episodes') 

stmt.step() 

stmt.step() 

stmt.step() 

c2.exec('BEGIN IMMEDIATE; UPDATE episodes SET ..; COMMIT;') 
stmt.finalize() 


假设 episodes 中 有 100 条 记录 ， 程 序 仅仅 访问 了 其 中 的 3 条 ， 这 时 会 发 生 什 么 情况 呢 ? 第 2 个 连 
接 会 得 到 SQLITE_BUSY。 


在 第 1 个 例子 中 ， 当 到 达 语 名 结果 集 尾部 时 ， 会 释放 SHARED 锁 ， 尽 管 还 没有 调用 finalize()。 
在 第 2 个 例子 中 ， 没 有 到 达 语 句 结 果 集 尾部 ，SHARED 锁 没有 释放 。 所 以 ，c2 不 能 执行 
UPDATE 操 作 。 


这 个 故事 的 中 心思 想 是 : 不 要 这 么 做 ， 尽 管 有 时 这 么 做 是 可 以 的 。 在 用 另 一 个 连接 进行 号 
作 之 前 ， 永 远 要 先 调用 finalize()。 


Ed 


享 缓 冲 区 模式 


现在 你 对 并 发 规则 已 经 很 清楚 了 ， 但 我 还 要 找 些 事 来 扰乱 你 。SQLite 提 供 一 种 可 选 的 并 发 模 
式 ， 称 为 共享 缓冲 区 模式 ， 它 允许 在 单一 的 线程 中 操作 多 个 连接 。 


在 共享 缓冲 区 模式 中 ， 一 个 线程 可 以 创建 多 个 连接 来 共享 相同 的 页 缓冲 区 。 进 这 组 连接 
可 以 有 多 个 “ 读 ? 和 一 个 “ 写 " 同 时 工作 于 相同 的 数据 库 。 缓 冲 区 不 能 在 线程 间 共 享 ， ee 
限制 在 创建 它 的 线程 中 。 因 此 ，" 读 ?和 "“ 写 ?就 需要 准备 处 理 与 表 锁 有 关 的 一 些 特殊 情况 。 


当 readers 读 表 时 ，SQLite 自 动 在 这 些 表 上 加 锁 ，Wwriter 就 不 能 再 改 这 些 表 了 。 如 果 Writer 试 图 
修改 一 个 有 读 锁 的 表 ， 会 得 到 SQLITE_LOCKED。 如 果 readers 运 行 在 read-uncommitted 模 式 
(通过 read_uncommitted pragma 来 设置 )， 则 当 readers 读 表 时 ，Writer 也 可 以 写 表 。 在 这 种 情 
况 下 ，SQLite 不 为 readers 所 读 的 表 加 读 锁 ， 结 果 就 是 readers 和 writer 互 不 干扰 。 也 因此 ， 当 
一 个 Writer 修 改 表 时 ， 这 些 readers 可 能 得 到 不 一 致 的 结果 。 


$063 核心 C API 


本 章 介绍 用 于 数据 库 操作 的 SQLite API。 第 5 章 已 经 介绍 了 API 如 何 工作 ， 本 章 关 注 细节 。 


本 章 从 几 个 例子 开始 ， 深 入 介绍 C API。 学 完 本 章 之 后 ， 你 会 看 到 每 个 C API 函 数 都 与 常用 的 
数据 库 操 作 有 关 ， 包 括 执行 命令 、 管 理事 务 、 取 记录 、 处 理 错误 等 等 。 


SQLite 的 版 本 3 的 API 包 括 大 约 80 个 函数 。 只 有 8 个 函数 在 连接 、 查 询 和 断 开 连接 时 是 必须 的 ， 
其 它 的 函数 用 来 完成 特定 的 任务 。 


如 第 5 章 所 述 ， 版 本 3 与 2 的 API 相 比 有 较 大 改变 。 最 值得 关注 的 一 个 改变 是 增加 了 对 UTF 的 支 
持 。 所 有 接受 字符 串 做 为 参数 或 返回 字符 串 的 函数 都 同时 具有 UTF-8 和 UTF-16 的 相似 体 。 例 
如 ，sqlite3_open()， 接 受 一 个 UTF-8 的 数据 库 名 做 参数 ; 而 sqlite3_ open16() 具 有 同样 的 功能 
与 格式 ， 但 参数 使 用 UTF-16 编 码 。 本 章 一 般 只 介绍 UTF-8 的 函数 ，UTF-16 版 本 仅仅 是 在 名 字 
上 有 微小 差别 。 


本 章 最 好 顺序 地 读 ， 如 果 在 细节 上 有 问题 ， 可 以 参考 附录 B。 


Z: 第 6、7 两 章 应 该 也 是 本 书 的 精华 了 ， 主 要 介绍 对 SQLite 进 行 编程 的 方法 。 大 多 数 
SQLite 的 使 用 者 可 能 更 关心 这 两 章 ， 但 我 又 不 开发 基于 SQLite 的 应 用 程序 ， 研 究 SQLite 纯 粹 
出 于 兴趣 ， 个 人 更 关心 SQLite 本 身 的 实现 方法 ， 所 以 对 这 部 分 内 容 只 是 略 做 浏览 。 关 心 这 部 
分 内 容 的 兄弟 还 是 得 自己 看 原文 。 


封装 的 查询 


你 已 经 熟悉 了 SQLite 执 行 查询 的 方法 ， 包 括 在 一 个 单独 的 函数 中 执行 封装 的 SQL。 我 们 从 封 
装 的 SQL 开始 介绍 ， 因 为 这 些 函 数 简 单 、 独 立 且 易 用 。 它 们 是 好 的 起 点 ， 使 你 能 得 到 乐趣 ， 
又 不 会 被 过 多 的 细节 所 困扰 。 


连接 和 断 开 连接 


在 执行 SQL 命令 之 前 ， 首 先 要 连接 数据 库 。 因 为 SQLite 数 据 库存 储 在 一 个 单独 的 操作 系统 文 
件 当中 ， 所 以 连接 数据 库 可 以 理解 为 打开" 数据库。 同样 ， 断 开 连 接 也 就 是 关闭 数据 库 。 


打开 数据 库 用 sqlite3_open() 或 sqlite3 open16() 函 数 ， 它 们 的 声明 如 下 : 


int sqlite3_open( 


const char *filename, /* Database filename (UTF-8) */ 
sqlite3 **ppDb /* OUT: SQLite db handle */ 

); 

int sqlite3_open16( 
const void *filename, /* Database filename (UTF-16) */ 
sqlite3 **ppDb /* OUT: SQLite db handle */ 


Ne 


其 中 ，filename 参 数 可 以 是 一 个 操作 系统 文件 名 ， 或 字符 串 "“memory:"'， 或 一 个 空 指针 
(NULL)。 用 后 两 者 将 创建 内 存 数 据 库 。 如 果 filename 不 为 室 ， 先 尝试 打开 ， 如 果 文 件 不 存 
在 ， 则 用 这 个 名 字 创 建 一 个 新 的 数据 库 。 


关闭 连接 使 用 sqlite3_close() 函 数 ， 它 的 声明 如 下 : 


int sqlite3 close(sqlite3*); 


为 了 sqlite3_close() 能 够 成 功 执行 ， 所 有 与 连接 所 关联 的 已 编译 的 查询 必须 被 定案 。 如 果 仍 然 
有 查询 没有 定案 ，sqlite3_close() 将 返回 SQLITE_BUSY 和 错误 信息 : Unable to close due to 
unfinalized statements ° 
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函数 sqlite3_exec() 提 供 了 一 种 执行 SQL 命令 的 快速 、 简 单 的 方法 ， 它 特别 适合 处 理 对 数据 库 
的 修改 操作 (不 需要 返回 数据 )。sqlite3_exec() 的 声明 如 下 : 


int sqlite3_exec( 


sqlite3*, /* An open database */ 

const char *sql, /* SQL to be executed */ 
sqlite_callback, /* Callback function */ 

void *data /* 1st argument to callback function */ 
char **errmsg /* Error msg written here */ 


SQL 命 令 由 sql 参 数 提供 ， 它 可 以 由 多 个 SQL 命 令 构成 ，sqlite3_exec() 会 对 其 中 每 个 命令 进行 
分 析 并 执行 ， 直 到 命令 串 结束 或 遇 到 一 个 错误 。 列 表 6-1( 来 自 create.c) 说 明了 sqlite3_exec() 的 
用 法 : 


列表 6-1 对 简单 的 命令 使 用 sqlite3_exec() 


#include <stdio.h> 

#include <stdlib.h> 

#include "util.h" 

#pragma comment(lib, "sqlite3.1lib") 
int main(int argc, char **argv) 


{ 
sqlite3 *db; 
char *zErr; 
int rc; 
char *sql; 
rc = sqlite3_open("test.db", &db); 
if (rc) { 
fprintf(stderr, "Can't open database: %s\n", sqlite3_errmsg(db)); 
sqlite3 close(db); 
exit(1); 
sql - "create table episodes( id integer primary key," 
X name text, cid int)"; 
rc = sqlite3_exec(db, sql, NULL, NULL, &zErr); 
if (rc !- SQLITE OK) { 
if (zErr != NULL) { 
fprintf(stderr, "SQL error: %s\n", zErr); 
sqlite3 free(zErr); 
} 
} 
sql = "insert into episodes (name,id) values ('Cinnamon Babka2',1)"; 
rc = sqlite3_exec(db, sql, NULL, NULL, &zErr); 
if (rc !- SQLITE OK) { 
if (zErr != NULL) { 
fprintf(stderr, "SQL error: %s\n", zErr); 
sqlite3 free(zErr); 
} 
} 
sqlite3_close(db); 
return 0; 
} 


处 理 记 录 


如 第 5 章 所 述 ， 还 是 有 可 能 从 sqlite3_exec() 取 得 记录 的 。sqlite3_exec() 包 含 一 个 回 叫 
(callback) 机 制 ， 提 供 了 一 种 从 SELECT 语 句 得 到 结果 的 方法 。 这 个 机 制 由 sqlite3_exec() 部 数 
的 第 3 和 第 4 个 参数 实现 。 第 3 个 参数 是 一 个 指向 回 叫 函 数 的 指针 ， 如 果 提 供 了 回 叫 函数 ， 
SQLite 则 会 在 执行 SELECT 语 乡 期 间 在 遇 到 每 一 条 记录 时 调用 回 叫 函数 。 回 叫 函 数 的 声明 如 


typedef int (*sqlite3_callback) ( 
void*, /* Data provided in the 4th argument of sqlite3_exec() */ 
int, /* The number of columns in row */ 
char**, /* An array of strings representing fields in the row */ 
char** /* An array of strings representing column names */ 


函数 sqlite3_exec() 的 第 4 个 参数 是 一 个 指向 任何 应 用 程序 指定 的 数据 的 指针 ， 这 个 数据 是 你 准 
备 提供 给 回 叫 函 数 使 用 的 。SQLite 将 把 这 个 数据 作为 回 叫 函 数 的 第 1 个 参数 传递 。 


总 之 ，sqlite3_exec() 允 许 你 处 理 一 批 命 令 ， 并 且 你 可 以 使 用 回 叫 函数 来 收集 所 有 返回 的 数 
据 。 例 如 ， 先 向 episodes 表 插入 一 条 记录 ， 再 从 中 查询 所 有 记录 ， 所 有 这 些 都 在 一 个 
sqlite3_exec() 调 用 中 完成 。 完 整 的 程序 代码 见 列表 6-2， 它 来 自 exec.c。 


列表 6-2 将 sqlite3_exec() 用 于 记录 处 理 


#include <stdio.h> 
#include <stdlib.h> 
#include "util.h" 
#pragma comment(lib, "sqlite3.lib") 
int callback(void* data, int ncols, char** values, char** headers); 
int main(int argc, char **argv) 
{ 

sqlite3 *db; 

int rc; 

char *sql; 

char *zErr; 

char* data; 
rc = sqlite3_open("test.db", &db); 
if(rc) { 
fprintf(stderr, "Can't open database: %s\n", sqlite3 errmsg(db)); 
sqlite3_close(db); 
exit(1); 

} 

data = "callback function called"; 

sql = "insert into episodes (name, cid) values ('Mackinaw Peaches', 1);" 

"select * from episodes;"; 
rc = sqlite3_exec(db, sql, callback, data, &zErr); 
if(rc != SQLITE OK) { 
if (zErr != NULL) { 
fprintf(stderr, "SQL error: %s\n", zErr); 
sqlite3 free(zErr); 
} 


} 
sqlite3_close(db); 
return 0; 


} 


int callback(void* data, int ncols, char** values, char** headers) 


te 
int 1; 
fprintf(stderr, "%s: ", (const char*)data); 
for(i=0; i < ncols; i++) { 
fprintf(stderr, "%s=%s ", headers[i], values[i]); 
} 


fprintf(stderr, "\n"); 
return 0; 


字符 串 处 理 


int main(int argc, char **argv) 


{ 
char *sql; 
char *trouble = "'Here's trouble'"; 
sql = sqlite3_mprintf("insert into x values('%q')", trouble); 
fprintf(stdout, "%s\n", sql); 
sqlite3_free(sql); 
return 0; 
} 


The result sql will contain 
insert into x values("Here"s trouble") 


Listing 6-3. Using sqlite3_vmprintf() 


int execute(sqlite3 *db, const char* sql, ...) 
{ 
char *err, *tmp; 
va_list ap; 
va_start(ap, sql); 
tmp = sqlite3 vmprintf(sql, ap); 
va_end(ap); 
int rc = sqlite3_exec(db, tmp, NULL, NULL, &err); 
if(rc !- SQLITE OK) { 
if (err != NULL) { 
fprintf(stdout, "execute() : Error %i : %s\n", rc, err); 
sqlite3 free(err); 


j 


sqlite3_free(tmp); 
return rc; 


Get Table #749 


int sqlite3_get_table( 
sqlite3*, /* An open database */ 
const char *sql, /* SQL to be executed */ 
char ***resultp, /* Result written to a char *[] that this points to */ 
int *nrow, /* Number of result rows written here */ 
int *ncolumn, /* Number of result columns written here */ 
char **errmsg /* Error msg written here */ 


NF 


Listing 6-4. Using sqlite3_get_table 


void main(int argc, char **argv) 
{ 
sqlite3 *db; 
char *zErr; 
Ine cy 
char *sql; 
char **result; 
int nrows, ncols; 
/* Connect to database, etc. */ 
rc = sqlite3_open("test.db", &db); 
sql = "select * from episodes;"; 
rc = sqlite3_get_table(db, sql, &result, &nrows, &ncols, &zErr); 
/* Do something with data */ 
printf ("rows=%d, cols=%d\n", nrows, ncols); 
for (1=0;i<=nrows;it++) 
printf ("%-5s%-20s%-5s\n", result [3*i], result [3*i+1], result[3*i+2]); 
/* Free memory */ 
sqlite3_free_table(result); 


If, for example, the result set returned is of the form 


rows=2,cols=3 


id name cid 
1 Cinnamon Babka2 (null) 
2 Mackinaw Peaches dl 


预 处 理 的 查询 


As you'll recall from Chapter 5, prepared queries are performed in three basic steps: 
compilation, execution, and finalization. This process is illustrated in Figure 6-1. 


i 1 
[=f sglite3 prepare( ) 
j 








. 






sglite3 step() 





SQLITE ROW? 
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salite3. finakze() 








Figure 6-1. Prepared query processing 


Now that you've seen the whole process, let's go through an example. A simple, complete 
program using a prepared query is listed in Listing 6-6. It is taken from select.c in the 
examples. 


Listing 6-6. Using Prepared Queries 


#include <string.h> 
int main(int argc, char **argv) 


{ 
int rc, i, ncols; 
sqlite3 *db; 
sqlite3_stmt *stmt; 
char *sql; 
const char *tail; 
rc = sqlite3_open("test.db", &db); 
if(rc) { 
fprintf(stderr, "Can't open database: %s\n", sqlite3_errmsg(db)); 
sqlite3_close(db); 
exit(1); 
} 
sql = "select * from episodes;"; 
rc = sqlite3_prepare(db, sql, (int)strlen(sql), &stmt, &tail); 
if(rc != SQLITE OK) { 
fprintf(stderr, "SQL error: %s\n", sqlite3_errmsg(db)); 
} 
rc = sqlite3_step(stmt); 
ncols = sqlite3_column_count(stmt); 
while(rc == SQLITE_ROW) { 
for(i=0; i < ncols; i++) { 
fprintf(stderr, "'%s' ", sqlite3_column_text(stmt, i)); 
H 
fprintf(stderr, "\n"); 
re = sqlite3_step(stmt); 
sqlite3_finalize(stmt); 
sqlite3_close(db); 
return 0; 
} 


跟 sqlite3_exec() 相 似 ，sqlite3_prepare() 也 可 以 接受 一 个 包括 多 个 SQL 语句 的 字符 串 。 不 同 的 
是 sqlite3_prepare() 只 处 理 字符 串 中 的 第 1 个 语句 。But it does make it easy for you to process 
subsequent SQL statements in the string by providing the pzTailout parameter. After you call 
sqlite3_prepare(), it will point this parameter (if provided) to the starting position of the next 
statement in the zSQL string. Using pzTail, processing a batch of SQL commands in a given 
string can be executed in a loop as follows: 


while(sqlite3 complete(sql) { 
rc = sqlite3_prepare(db, sql, strlen(sql), &stmt, &tail); 
/* Process query results */ 
/* Skip to next command in string. */ 
sql = tail; 


FLAC k 


取 字 段 信息 
你 可 以 使 用 sqlite3_column_name() 来 取得 各 字段 的 名 称 : 


const char *sqlite3_column_name( sqlite3_stmt*, /* statement handle */ 
int iCol /* column ordinal */); 


类 似 地 ， 你 可 以 使 用 sqlite3_column_type() 取 得 各 字段 的 存储 类 : 


int sqlite3_column_type( sqlite3_stmt*, /* statement handle */ 
int iCol /* column ordinal */); 


这 个 函数 返回 一 个 整数 值 ， 代 表 5 个 存储 类 的 代码 ， 定 义 如 下 : 


#define SQLITE_INTEGER 1 
#define SQLITE FLOAT 2 
#define SQLITE TEXT 3 
#define SQLITE_BLOB 4 
#define SQLITE_NULL 5 


这 些 是 SQLite 本 身 的 类 型 ， 或 称 存储 类 ， 在 第 4 章 有 详细 介绍 。All data stored within a 
SQLite database is stored in one of these five forms, depending on its initial representation 
and the affinity of the column. For our purposes, the terms storage class and data type are 
synonymous. For more information on storage classes, see the sections “Storage Classes” 
and “Type Affinity” in Chapter 4. 


你 可 以 使 用 sqlite3_column_decltype() 函 数 获得 字段 声明 的 数据 类 型 : 


const char *sqlite3_column_decltype( sqlite3 stmt*, /* statement handle */ 
int /* column ordinal */); 


如 果 结 果 集 中 的 一 列 不 是 来 自 一 个 实际 的 字段 (如 来 自 于 表达 式 、 函 数 或 聚合 的 结果 )， 这 个 函 
数 将 返回 NULL。For example, suppose you have a table in your database defined as 


CREATE TABLE ti(c1 INTEGER); 


Then you execute the following query: 


SELECT c1 + 1, © FROM t1; 


In this case, sqlite3_column_decltype() will return INTEGER for the first column and NULL 
for 


the second. 
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const char *sqlite3 column database name(sqlite3 stmt *pStmt, int iCol); 


const char *sqlite3 column table name(sqlite3 stmt *pStmt, int iCol); 
const char *sqlite3 column origin name(sqlite3 stmt *pStmt, int iCol); 








The first function will return the database associated with a column, the second its table, and 


the last function returns the column’s actual name as defined in the schema. That is, if you 


assigned the column an alias in the SQL statement, sqlite3_column_origin_name() will 
return 


its actual name as defined in the schema. Note that these functions are only available if you 
compile SQLite with the SQLITE ENABLE COLUMN METADATA preprocessor directive. 
列 元 数据 : 


字段 的 详细 信息 可 以 从 一 个 独立 的 query 获 得 ， 使 用 sqlite3_ table column metadata() A > 
声明 如 下 : 


SQLITE_API int sqlite3_table_column_metadata( 





sqlite3 *db, /* Connection handle */ 

const char *zDbName, /* Database name or NULL */ 

const char *zTableName, /* Table name */ 

const char *zColumnName, /* Column name */ 

char const **pzDataType, /* OUTPUT: Declared data type */ 

char const **pzCollSeq, /* OUTPUT: Collation sequence name */ 

int *pNotNull, /* OUTPUT: True if NOT NULL constraint exists */ 
int *pPrimaryKey, /* OUTPUT: True if column part of PK */ 

int *pAutoinc /* OUTPUT: True if column is auto-increment */ 


ye 
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名 、 表 名 和 列 名 。 可 选 的 数据 库 名 指明 附加 的 逻辑 数据 库 名 (一 个 连接 上 可 能 附加 多 个 数据 
库 )。 表 名 和 字段 名 是 必须 的 。 


取 字 段 值 
可 以 使 用 sqlite3_column_xxx() 函 数 取 当 前 记录 中 每 个 字段 的 值 ， 其 一 般 形式 为 : 


Xxx sqlite3 column xxx( sqlite3 stmt*, /* statement handle */ 
int iCol /* column ordinal */); 


XXX 表示 你 希望 得 到 的 数据 类 型 。sqlite3_column_xxx() 包 括 以 下 函数 : 


int sqlite3_column_int(sqlite3_stmt*, int iCol); 

double sqlite3_column_double(sqlite3_stmt*, int iCol); 

long long int sqlite3_column_int64(sqlite3_stmt*, int iCol); 

const void *sqlite3_column_blob(sqlite3_stmt*, int iCol); 

const unsigned char *sqlite3_column_text(sqlite3_stmt*, int iCol); 
const void *sqlite3 column texti6(sqlite3 stmt*, int iCol); 


对 每 个 函数 ，SQLite 都 会 将 字段 值 从 存储 类 转化 为 函数 指定 的 结果 类 型 。Table 6-1 中 是 转换 
规则 。 


Table 6-1. Column Type Conversion Rules 


Internal Type Requested Type Conversion 


NULL INTEGER Result is O*. 
NULL FLOAT Result is 0.0\. 
NULL TEXT Result is a NULL pointer. 
cm R= 
一 个 实际 的 例子 


To help solidify all of these column functions, Listing 6-7 (taken from columns.c) illustrates 
using the functions we've described to retrieve column information and values for a simple 
SELECT statement. 


Listing 6-7. Obtaining Column Information 


#include <string.h> 
int main(int argc, char **argv) 
{ 
int rc, i, ncols, id, cid; 
char *name, *sql; 
sqlite3 *db; sqlite3_stmt *stmt; 
sql = "select id,cid,name from episodes"; 
sqlite3_open("test.db", &db); 
sqlite3_prepare(db, sql, strlen(sql), &stmt, NULL); 
ncols = sqlite3_column_count(stmt); 
rc = sqlite3_step(stmt); 
/* Print column information */ 
for(i=0; i < ncols; i++) { 
fprintf(stdout, "Column: name=%s, storage class=%i, declared=%s\n", 
sqlite3_column_name(stmt, i), 
sqlite3_column_type(stmt, i), 
sqlite3_column_decltype(stmt, i)); 


} 
fprintf(stdout, "\n"); 
while(rc == SQLITE_ROW) { 
id = sqlite3_column_int(stmt, 0); 
cid = sqlite3_column_int(stmt, 1); 
name = (char *)sqlite3_column_text(stmt, 2); 
if(name != NULL){ 
fprintf(stderr, "Row: id=%i, cid=%i, name='%s'\n", id,cid,name) ; 
} else { 
/* Field is NULL */ 
fprintf(stderr, "Row: id=%i, cid=%i, name=NULL\n", id,cid); 


rc = sqlite3_step(stmt); 
sqlite3_finalize(stmt); 


sqlite3_close(db); 
return 0; 


参数 化 的 查询 


insert into foo values (?,?,?) 
sqlite3_prepare() 
tie | 回回 器 
mt 


st 










sqlite3_bind_int(stmt, 1, 2) 





sqlite3 bind text(stmt, 2, "pi") 


sqlite3 bind double(stmt, 3, "3.14") 


Figure 6-2. SQL parameter binding 


有 些 AP| 是 很 可 能 出 错 的 ， 在 编码 时 总 要 记得 3 件 事 : BIR ^ TEM S Feschemark € e 


处 理 错 误 


很 多 API 函 数 返回 整数 结果 码 ， 这 表示 它们 可 以 返回 错误 码 。 在 使 用 一 个 函数 之 前 ， 应 该 仔细 
阅读 关于 该 函数 的 说 明 ( 见 附录 B)， 看 它 可 能 引发 什么 错误 。API 中 定义 了 大 约 23 种 错误 。 所 
有 的 SQLite 返 回 码 见 表 6-2。 所 有 能 够 返回 这 些 码 的 函数 包括 : 


sqlite3_bind_xxx() 
sqlite3_close() 
sqlite3_create_collation() 
sqlite3 collation needed() 
sqglite3 create function() 
sqlite3_prepare() 
sqlite3_exec() 
sqlite3_finalize() 
sqlite3_get_table() 
sqlite3_open() 
sqlite3_reset() 
sqlite3_step() 

sqlite3 transfer bindings() 


可 以 使 用 函数 sqlite3_errmsg() 获 得 附加 的 错误 信息 ， 其 声明 如 下 : 


const char *sqlite3_errmsg(sqlite3 *); 


它 以 一 个 连接 句柄 作 和 参数， 返回 该 连接 最 近 的 一 条 错误 信息 。 如 果 还 没有 发 生 错 误 ， 它 返 
“not an error" ° 


表 6-2 SQLit 的 返回 码 


返回 码 


SQLITE_OK 


SQLITE_ERROR 


SQLITE_PERM 


SQLITE_ABORT 
SQLITE_BUSY 
SQLITE_LOCKED 
SQLITE_NOMEM 
SQLITE_READONLY 
SQLITE_INTERRUPT 
SQLITE_IOERR 


SQLITE_CORRUPT 


SQLITE_CANTOPEN 
SQLITE_PROTOCOL 


说 明 
The operation was successful. 


General SQL error or missing database. It may be possible 
to obtain more error information depending on the error 
condition (SQLITE_SCHEMA, for example). 


Access permission denied. Cannot read or write to the 
database file. 


A callback routine requested an abort. 

The database file is locked. 

A table in the database is locked. 

A call to malloc() has failed within a database operation. 
An attempt was made to write to a read-only database. 
Operation was terminated by sqlite3_interrupt(). 

Some kind of disk I/O error occurred. 


The database disk image is malformed. This will also occur 
if an attempt is made to open a non-SQLite database file as 
a SQLite database. SQLITE_FULL Insertion failed because 
the database is full. There is no more space on the file 
system or the database file cannot be expanded. 


SQLite was unable to open the database file. 


The database is locked or there has been a protocol error. 


SQLITE_EMPTY (Internal only) The database table is empty. 
SQLITE_SCHEMA The database schema has changed. 


Abort due to constraint violation. This constant is returned if 
the SQL statement would have violated a database 
constraint (such as attempting to insert a value into a unique 
index that already exists in the index). 


SQLITE_CONSTRAINT 


Data type mismatch. An example of this is an attempt to 
insert non-integer data into a column labeled INTEGER 
PRIMARY KEY. For mostcolumns, SQLite ignores the data 
type and allows any kind of data to be stored. But an 
INTEGER PRIMARY KEY column is only allowed to store 
integer data. 


SQLITE_MISMATCH 


Library was used incorrectly. This error might occur if one or 
more of the SQLite API routines is used incorrectly. 
Examples of incorrect usage include calling sqlite3_exec() 
after the database has been closed using sqlite3_close() or 
calling sglite3 exec() with the same database pointer 
simultaneously from two separate threads. 


SQLITE_MISUSE 


Uses OS features not supported on host. This value is 
returned if the SQLite library was compiled with large file 
support (LFS) enabled butLFS isn’t supported on the host 
operating system. 


SQLITE_NOLFS 


Authorization denied. This occurs when a callback function 


SQLITE_AUTH installed using sqlite3_set_authorizer() returns 
SQLITE_DENY. 

SQLITE_ROW sqlite3_step() has another row ready. 

SQLITE_DONE sqlite3_step() has finished executing. 


处 理 忙 状态 


操作 控制 


API 提 供 了 几 个 函数 ， 可 以 用 来 监视 或 管理 编译 期 间 和 运行 时 的 SQL 命令 。 这 些 函 数 允 许 你 奸 
立 回 叫 函数 ， 并 以 此 对 不 同 的 数据 库 事件 进行 监视 和 控制 ( 当 事 件 发 生 时 ) 。 
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void *sqlite3_commit_hook( sqlite3 *cnx, /* database handle */ 
int(*xCallback)(void *data), /* callback function */ 
void *data); /* application data */ 
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void *sqlite3 rollback hook(sqlite3 *cnx, void(*xCallback)(void *data), void *data); 
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函数 sqlite3_update_hook() 用 来 监 0 的 UPDATE、INSERT 和 DELETE 操 
作 ， 对 这 些 操作 中 所 涉及 的 每 一 行 都 进行 监 声明 如 下 : 


void *sqlite3_update_hook( 
sqlite3 *cnx, 
void(*)(void *, int, char const*, char const*, sqlite int64), 
void *data); 


The first argument of the callback function is a pointer to application-specific data, which you 
provide in the third argument. The callback function has the following form: 


void callback ( void * data, 
int operation code, 
char const *db name, 
char const *table name, 
sqlite_int64 rowid), 


授权 函数 


sqlite3_set_authorizer() 是 最 强 有 力 的 事件 过 滤 函 数 。 用 它 可 以 在 查询 编译 的 时 候 对 其 进行 监 
视 和 控制 。 其 声明 如 下 : 


int sqlite3_set_authorizer( 
sqlite3*, 
int (*xAuth)( void*, int, 
const char*, const char*, 
const char*,const char*), 
void *pUserData 


); 


其 中 注册 了 Aa 作为 授权 函数 。SQLite 在 一 些 数据 库 事件 的 命令 编译 阶段 将 会 
调用 它 ( 不 是 在 执行 阶段 )。 这 个 函数 的 用 意 是 使 用 SQLite 能 够 安全 地 执行 用 户 提供 的 
SQL(user-supplied SQL) ° dee 了 一 种 途径 将 这 类 SQL 限制 在 特定 的 操作 上 或 拒绝 对 某 些 


表 或 字段 的 存 取 。 
Callback 的 声明 形式 如 下 : 


int auth( void*, /* user data */ 
int, /* event code */ 
const char*, /* event specific */ 
const char*, /* event specific */ 
const char*, /* database name */ 
const char* /* trigger or view name */ ); 


第 1 个 参数 是 一 个 数据 指针 ， 它 会 传递 给 sqlite3_set_authorizer() 函 数 的 第 4 个 参数 。 第 2 个 参 
数 是 一 个 常量 ， 可 选 值 在 表 6-3 中 列 出 。 这 些 常 量 值 表 示 需 要 授权 的 是 什么 操作 。 第 3、4 个 函 
数 的 含义 决定 于 事件 代码 (第 2 个 参数 ， 参 表 6-3) 。 


第 5 个 参数 是 数据 库 名 。 第 6 个 参数 是 最 内 层 触发 器 或 视图 的 名 称 ， 就 是 这 个 触发 器 或 视图 企 
图 存 取 数据 库 。 如 果 这 个 参数 为 NULL， 则 说 明 这 种 存 取 的 企图 是 直接 由 顶层 的 SQL 引 发 的 。 


授权 函数 的 返回 值 应 该 是 SQLITE_OK、SQLITE_DENY 或 SQLITE_IGNORE 之 一 。 前 两 个 值 
的 含义 对 所 有 事件 都 是 确定 的 一 “接受 或 拒绝 SQL。SQLITE_DENY 将 会 取消 整个 SQL 语 钨 的 
执行 并 生成 一 个 错误 。 


SQLITE_IGNORE 的 含义 与 事件 有 关 。 如 果 SQL 语 名 是 读 或 改 记录 ， 会 在 语句 试图 操作 的 每 

个 字段 上 产生 SQLITE_READ 或 SQLITE_UPDATE 事 件 。 在 这 种 情况 下 ， 如 果 回 叫 函 数 返 回 

SQLITE IGNORE ， 这 些 字段 将 从 操作 中 被 排除 (高 : 别 的 字段 继续 操作 ， 这 些 字 段 就 不 操作 
了 )。 有 具体 说 ， 试 图 读 的 返回 NULL » 试图 写 的 则 什么 也 不 做 (silently fail) ° 


表 6-3 SQLite 的 授权 事件 


事件 代码 
SQLITE_CREATE_INDEX 
SQLITE_CREATE_TABLE 
SQLITE_CREATE_TEMP_INDEX 
SQLITE_CREATE_TEMP_TABLE 
SQLITE_CREATE_TEMP_TRIGGER 
SQLITE_CREATE_TEMP_VIEW 
SQLITE_CREATE_TRIGGER 
SQLITE_CREATE_VIEW 
SQLITE_DELETE 
SQLITE_DROP_INDEX 
SQLITE_DROP_TABLE 
SQLITE_DROP_TEMP_INDEX 
SQLITE_DROP_TEMP_TABLE 
SQLITE_DROP_TEMP_TRIGGER 
SQLITE_DROP_TEMP_VIEW 
SQLITE_DROP_TRIGGER 
SQLITE_DROP_VIEW 
SQLITE_INSERT 
SQLITE_PRAGMA 
SQLITE_READ 
SQLITE_SELECT 
SQLITE_TRANSACTION 
SQLITE_UPDATE 
SQLITE_ATTACH 
SQLITE_DETACH 
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参数 3 
Index name 
Table name 
Index name 
Table name 
Trigger name 
View name 
Trigger name 
View name 
Table name 
Index name 
Table name 
Index name 
Table name 
Trigger name 
View name 
Trigger name 
View name 
Table name 
Pragma name 
Table name 
NULL 

NULL 

Table name 
Filename 


Database name 


下 面 例子 说 明 授权 元 数 的 使 用 (完整 的 程序 在 authorizer.c 中 )。 


参数 4 
Table name 
NULL 
Table name 
NULL 
Table name 
NULL 
Table name 
NULL 
NULL 
Table name 
NULL 
Table name 
NULL 
Table name 
NULL 
Table name 
NULL 
NULL 


First argument or NULL 
Column name 

NULL 

NULL 

Column name 

NULL 

NULL 


这 是 一 个 很 长 的 例子 ， 会 用 授权 函数 对 很 多 不 同 的 数据 库 事件 进行 过 滤 ， 所 以 我 们 通过 程序 


片段 来 进行 说 明 。 见 列表 6-10。 
列表 6-10 授权 函数 示人 


授权 函数 的 一 般 形 式 为 : 


int auth( void* x, int type, 
const char* a, const char* b, 
const char* c, const char* d ) 


{ 
const char* operation = a; 
//printf( " %s ", event description(type)); 
/* Filter for different database events 
** from SQLITE TRANSACTION to SQLITE INSERT, 
** UPDATE, DELETE, ATTACH, etc. and either allow or deny 
** them. 
S 
return SQLITE_OK; 
} 


授权 函数 做 的 第 1 件 事 是 : 看 看 事务 状态 是 否 改变 ; 如 果 改 变 ， 则 输出 一 个 信息 : 


if((a != NULL) && (type == SQLITE TRANSACTION)) { 
printf(": %s 6AIfi", operation); 
} 


下 一 步 是 对 引起 schema 改 变 的 事件 进行 过 滤 : 


switch(type) { 

case SQLITE_CREATE_INDEX: 
case SQLITE_CREATE_TABLE: 
case SQLITE_CREATE_TRIGGER: 
case SQLITE CREATE VIEW: 
case SQLITE DROP INDEX: 
case SQLITE DROP TABLE: 
case SQLITE DROP TRIGGER: 
case SQLITE DROP VIEW: 


printf(": Schema, AtááÉ; £"); 


下 一 步 是 对 读 的 企图 进行 检查 ， 这 种 企图 是 基于 字段 的 。 这 里 ， 所 有 的 读 都 被 允许 ， 除 了 z 字 
段 。 当 要 读 zZ 字 段 时 ， 函 数 返 回 SQLITE_IGNORE， 这 将 导致 SQLite 在 读 这 个 字段 时 返回 
NULL， 从 而 有 效 地 保护 其 数据 。 


if(type == SQLITE_READ) { 
printf(": Read of %s.%s ", a, b); 
/* Block attempts to read column z */ 
if(strcmp(b,"z")--0) { 
printf("-» DENIED\n"); 
return SQLITE IGNORE; 


下 面 是 INSERT 和 UPDATE 的 过 滤 。 所 有 的 播 入 被 允许 。 对 X 字 段 的 修改 被 拒绝 。 这 样 不 会 锁 
住 UPDATE 的 执行 ， 而 是 简单 地 过 滤 掉 对 x 字段 的 修改 企图 。 


if(type == SQLITE_INSERT) { 
printf(": 2aeé%CA% into Xs ", a); 


if(type == SQLITE UPDATE) { 
printf(": Update of %s.%s ", a, b); 
/* Block updates of column x */ 
if(strcmp(b,"x")--0) { 
printf("-» DENIED\n"); 
return SQLITE IGNORE; 


最 后 ， 对 DELETE、ATTACH 和 DETACH 进 行 过 滤 ， 在 遇 到 这 些 事件 时 只 是 简单 地 给 出 通知 。 
if(type == SQLITE_DELETE) { 
printf(": Delete from %s ", a); 


} 
if(type == SQLITE_ATTACH) { 
printf(": %s", a); 


} 

if(type == SQLITE_DETACH) { 
printf("-> %s", a); 

H 


下 面 是 主 程序 ， 为 了 介绍 的 方便 ， 也 会 分 成 多 个 片段 。 


int main(int argc, char **argv) 
{ 

sqlite3 *db, *db2; 

char *zErr; 


int rc; 

xu mr um pe Ee mmu NC T D UAE oS, oR a ee Pa Ey E 
** Setup 

OK Se aia tol ae Holden MR. MD ns lee d MM e E QU le TH EE EN MERI RAE CIT RE NEA e or ee tO C A eR EN rg Be cas ORE EA EI 
yf 


/* Connect to test.db */ 

rc = sqlite3_open("test.db", &db); 

if(rc) { 
fprintf(stderr, "Can't open database: %s\n", sqlite3_errmsg(db)); 
sqlite3_close(db); 


exit(1); 
} 
Ge s imam E E Sh Tut ye a A Dl ot Den RS le E A T aE a a 
** Authorize and test 
DK T Wee NOR ae ir EREN NEON Oe TN Mo ELROD ee SpA EE ge AERE YA NES CP MAE JL AL ON ete, Be Ot Ml 
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/* Register the authorizer function */ 

sqglite3 set authorizer(db, auth, NULL); 

/* Test transactions events */ 

printf("program : Starting transaction\n"); 

sqlite3_exec(db, "BEGIN", NULL, NULL, &zErr); 

printf("program : Committing transaction\n"); 

sqlite3_exec(db, "COMMIT", NULL, NULL, &zErr); 

printf("program : Starting transaction\n"); 

sqlite3_exec(db, "BEGIN", NULL, NULL, &zErr); 

printf("program : Aborting transaction\n"); 

sqlite3_exec(db, "ROLLBACK", NULL, NULL, &zErr); 

// Test table events 

printf("program : Creating table\n"); 

sqlite3_exec(db, "create table foo(x int, y int, z int)", NULL, NULL, &zErr); 
printf("program : Inserting record\n"); 

sqlite3_exec(db, "insert into foo values (1,2,3)", NULL, NULL, &zErr); 
printf("program : Selecting record (value for z should be NULL)\n"); 
print sql result(db, "select * from foo"); 

printf("program : Updating record (update of x should be denied)\n"); 
sqlite3_exec(db, "update foo set x-4, y=5, z=6", NULL, NULL, &zErr); 
printf("program : Selecting record (notice x was not updated)\n"); 
print sql result(db, "select * from foo"); 

printf("program : Deleting record\n"); 

sqlite3_exec(db, "delete from foo", NULL, NULL, &zErr); 
printf("program : Dropping table\n"); 

sqlite3_exec(db, "drop table foo", NULL, NULL, &zErr); 


Several things are going on here. The program selects all records in the table, one of which 
is 


column z. We should see in the output that column z’s value is NULL. All other fields should 


contain data from the table. Next, the program attempts to update all fields, the most 
important 


of which is column x. The update should succeed, but the value in column x should be 


unchanged, as the authorizer denies it. This is confirmed on the following SELECT 
statement, 


which shows that all columns were updated except for column x, which is unchanged. The 


program then drops the foo table, which should issue a schema change notification from the 


previous filter. 


// Test ATTACH/DETACH 

// Connect to test2.db 

rc = sqlite3_open("test2.db", &db2); 

if(rc) { 
fprintf(stderr, "Can't open database: %s\n", sqlite3_errmsg(db2)); 
sqlite3_close(db2); 
exit(1); 


// Drop table foo2 in test2 if exists 

sqlite3_exec(db2, "drop table foo2", NULL, NULL, &zErr); 
sqlite3_exec(db2, "create table foo2(x int, y int, z int)", NULL, NULL, &zErr); 
// Attach database test2.db to test.db 

printf("program : Attaching database test2.db\n"); 

sqlite3_exec(db, "attach 'test2.db' as test2", NULL, NULL, &zErr); 

// Select record from test2.db foo2 in test.db 

printf("program : Selecting record from attached database test2.db\n"); 
sqlite3_exec(db, "select * from foo2", NULL, NULL, &zErr); 
printf("program : Detaching table\n"); 

sqlite3_exec(db, "detach test2", NULL, NULL, &zErr); 


A 
sqlite3_close(db); 
sqlite3_close(db2); 
return 0; 


线程 


如 第 2 章 所 述 ，SQLite 支 持 线程 。 在 多 线程 环境 下 使 用 SQLite 时 ， 有 一 些 基 本 规则 需要 遵守 。 


共 至 缓冲 区 模式 





Server Thread 


Page Cache 


$ 


lon 


Figure 6-3. The shared cache model 


共享 缓冲 区 模式 的 目录 是 为 了 节省 内 在 ，SQLite 中 有 几 个 函数 是 与 线程 和 内 存 管 理 有 关 的 。 
使 用 它们 可 以 限制 堆 的 尺寸 或 手工 地 发 起 内 存 清理 。 这 些 函 数 包括 : 
void sqlite3_soft_heap_limit(int N); 


int sqlite3_release_memory(int N); 
void sqlite3 thread cleanup(void); 


AE z x o 

ATZ 4 AC API 

本 章 介 绍 SQLite 的 新 技巧 。 前 一 章 涉及 一 般 的 数据 库 操作 ， 本 章 将 开始 创新 。 扩 充 API 提 供 3 
种 基本 方法 来 扩展 (或 说 定制 )SQLite， 和 包括 : 创建 用 户 自 定 义 函 数 、 聚 合 和 排序 序列 。 

用 户 自 定义 函数 是 编写 用 于 特定 应 用 的 SQL 蕊 数 。 一 旦 注册 ， 就 可 以 在 SQL 中 被 调用 。 


本 章 将 涉及 所 有 这 3 个 用 户 定义 的 扩展 工具 及 与 之 相关 的 API 辑 数 。 你 会 看 到 ， 当 与 其 它 工 
有 具 ， 如 触发 器 和 冲突 解决 等 结合 在 一 起 时 ， 用 户 定义 的 扩充 APl 是 强 有 力 的 ， 并 能 为 SQLite 创 
造 非凡 特色 。 


空 注 : 本 章 内 容 对 编程 还 是 很 有 用 的 ， 但 我 对 这 部 分 内 容 只 是 略 做 浏览 。 关 心 这 部 分 内 容 的 
兄弟 还 是 得 自己 看 原文 。 


API 


AP ARLES ` HEURE XS) EATEN o CAIR A ik E IE E P o AMR 
可 能 会 把 它们 当成 存储 过 程 看 待 ， 而 忘记 了 它们 是 在 数据 库 之 外 的 。 它 们 存在 于 程序 库 
(librarie) 中 ， 其 生命 周期 严格 地 限制 在 你 的 程序 之 内 。| 


EA Bax 


步 进 函数 
自 定义 函数 和 聚合 的 步 进 函 数 是 一 样 的 ， 可 如 下 定义 : 


void fn(sqlite3_context* ctx, int nargs, sqlite3_value** values) 


I 


值 


ES 
n 


返回 值 


一 个 完整 的 例子 


Listing 7-2. The main Function 


int main(int argc, char **argv) 


eae: 
int rc; 
sqlite3 *db; 
const char* sql; 
sqlite3_open("test.db", &db); 
sqlite3_create_function( db, "function", -1, SQLITE UTF8, NULL, 
function, NULL, NULL); 
/* Turn on SQL logging */ 
//log sql(db, 1); 
/* Call function with one text argument. */ 
execute(db, "select function(1)"); 
/* Call function with several arguments of various types. */ 
execute(db, "select function(1, 2.71828)"); 
/* Call function with variable arguments, the first argument's value 
** being 'fail'. This will trigger the function to call 
** sglite3 result error(). */ 
execute(db, "select function('fail', 1, 2.71828, 'three', X'0004', NULL)"); 
/* Done */ 
sqlite3_close(db); 
return 0; 
} 


Listing 7-3. A Vanilla User-Defined Function 


void function(sqlite3_context* ctx, int nargs, sqlite3_value** values) 
{ 
int i; const char *msg; 
fprintf(stdout, "function() : Called with %i arguments\n", nargs); 
for(i=0; i < nargs; i++) { 
fprintf( stdout, " arg %i: value=%-7s type=%i\n", i, 
sqlite3 value text(values[i]), 
sqlite3 value type(values[i])); 


if(stremp((const char *)sqlite3 value text(values[0]), "fail") == 0) { 
msg = "function() : Failing because you told me to."; 
sqlite3 result error(ctx, msg, strlen(msg)); 
fprintf(stdout, "\n"); 
return; 


} 
fprintf(stdout, "\n"); 
sqlite3_result_int(ctx, 0); 


一 个 实际 的 应 用 程序 


Wy 


select sum(id) from foo 
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Figure 7-1. Query processing with aggregates 


一 个 实际 的 例子 


Listing 7-9. The sum_int() Test Program 


int main(int argc, char **argv) 


= 
int rc; 
sqlite3 *db; 
char *sql; 
rc = sqlite3_open("test.db", &db); 
if(rc) { 
print_error(db, "Can't open database"); 
exit(1); 
à 
/* Create aggregate table, add records. */ 
setup(db); 
/* Register aggregate. */ 
fprintf(stdout, "Registering aggregate sum int()*n"); 
log sql(db, 1); 
sqlite3 create function( db, "sum int", 1, SQLITE UTF8, db, 
NULL, step, finalize); 
Testkit 
fprintf(stdout, "\nRunning query: \n"); 
sql = "select sum_int(id) from aggregate"; 
print_sql_result(db, sql); 
/* Done. */ 
sqlite3_close(db); 
return 0; 
} 
步 进 函 数 


The step() function is shown in Listing 7-10. 


Listing 7-10. The sum_int() Step Function 


void step(sqlite3 context* ctx, int ncols, sqlite3_value** values) 


sum* s; 
int x; 
= (sum*)sqlite3 aggregate context(ctx, sizeof(sum)); 
if(sqlite3 aggregate count(ctx) == 1) { 
S->x = 0; 


x = sqlite3_value_int(values[0]);; 

S-»X += X; 

fprintf(stdout, "step() : value=%i, total=%i\n", x, s-»X); 
The value sum is a struct that is specific to this example and is defined as follows: 
typedef struct { 

int x; 
) sum; 


聚合 的 Context 


Finalize 函数 
Listing 7-11. The sum_int() Finalize Function 


void finalize(sqlite3_context* ctx) 


{ 
sum* s; 
= (sum*)sqlite3_aggregate_context(ctx, sizeof(sum)); 
sqlite3_result_int(ctx, s->x); 
fprintf(stdout, "finalize() : total=%i\n\n", s-»x); 
H 


标准 的 排序 法 类 型 


个 简单 的 例子 


Compare & 4 


Listing 7-12. The Political Collation Function 


int political_collation( void* data, int 11, const void* s1, 
int 12, const void* s2 ) 
{ 


int value, opinion; struct tm* t; time_t rt; 
/* Get the unpolitical value */ 
value = strcmp(s1,s2); 
/* Get the date and time */ 
time(&rt); 
t = localtime(&rt); 
/* Form an opinion */ 
switch(t->tm_wday) { 
case 0: /* Monday yes 27 
opinion = value; 
break; 
case 1: /* Tueday no 2 
opinion = -value; 
break; 
case 2: /* Wednesday bigger is better */ 
opinion = 11 >= 12 ? -1:1; 
break; 
case 3: /* Thursday strongly no vy 
opinion - -100; 
break; 
case 4: /* Friday strongly yes y 
opinion = 100; 
break; 
case 5: /* Saturday golf, everything's the same */ 
opinion = 0; 
break; 
default: /* Sunday - Meet the Press, opinion changes 
by the hour */ 
opinion = 2*(int)sin(t->tm_hour*180); 
} 
/* Now change it on a whim */ 
opinion = rand()-(RAND MAX/2) > © ? -1:1; 
return opinion; 


测试 程序 


Listing 7-13. The Political Collation Test Program 


int main(int argc, char **argv) 


ae 

int rc; 
sqlite3 *db; 
char *sql; 
/* For forming more consistent political opinions. */ 
srand( (unsigned) time(NULL) ); 
rc = sqlite3_open("test.db", &db); 
if(rc) { 

print_error(db, "Can't open database"); 

exit(1); 
/* Create issues table, add records. */ 
setup(db); 
/* Register collating sequence. */ 
fprintf(stdout, "1. Register political collating sequence\n\n"); 
sqlite3_create_collation( db, "POLITICAL", 

SQLITE_UTF8, db, 
political collation ); 
/* Turn SQL logging on. */ 
log sql(db, 1); 
/* Test default collation. */ 
fprintf(stdout, "2. Select records using default collation.\n"); 
sql - "select * from issues order by issue"; 
print sql result(db, sql); 
/* Test Oracle collation. */ 
fprintf(stdout, "\nSelect records using political collation. n"); 
sql - "select * from issues order by issue collate POLITICAL"; 
print sql result(db, sql); 
/* Done. */ 
sqlite3_close(db); 
return 0; 
} 


按 需 排序 (Collation on Demand) 


Listing 7-14. Collation Registration Function 


void crf( void* data, sqlite3* db, 
int eTextRep, const char* cname) 


{ 
if(strcmp(collation name, "POLITICAL") == 0) { 
/* Political collation has not been registered and is now needed */ 
sqlite3_create_collation( db, "POLITICAL", 
SQLITE_UTF8, db, 
political collation ); 
) else { 
/* Punt: Use some default comparison function this collation. */ 
sqlite3 create collation( db, collation name, 
SQLITE UTF8, db, 
default collation ); 
} 
} 


一 个 实际 的 应 用 程序 


FESS dh BK 


Listing 7-15. Oracle Date Collation Function 


int oracle_date_collation( void* data, 
int leni, const void* arg1, 
int len2, const void* arg2 ) 


int len; 
date d1; 
date d2; 
char zDate1[25]; 
char zDate2[25]; 
/* Copy date 1 */ 
if(leni » 24) ( 
len = 24; 
) else { 
len - leni; 
} 


strncpy(&zDate1[0], argi, len); 
zDatei[len] = '\0'; 
/* Copy date 2 */ 
if(len2 > 24) { 
len = 24; 
) else { 
len - len2; 


strncpy(&zDate2[0], arg2, len); 

zDate2[len] = '\0'; 

/* Convert dates to date struct */ 

oracle_date_str_to_struct(zDate1, &d1); 

oracle date str to struct(zDate2, &d2); 

fprintf(stdout, "collate fn() : datei=%s, date2=%s\n", zDate1, zDate2); 
/* Compare structs */ 

if(di.year « d2.year) 

{ 


return -1; 


else if(d1.year > d2.year) 
{ 


return 1; 


/* If this far, years are equal. */ 
if(di.month < d2.month) 


{ 


return -1; 


} 
else if(d1.month > d2.month) 
{ 


return 1; 


/* If this far, months are equal. */ 
if(di.day < d2.day) 
{ 
return -1; 
} 
else if(di.day > d2.day) 
{ 


return 1; 


/* If this far, dates are equal. */ 
return 0; 


日 期 解析 


Listing 7-16. The Oracle Date Parsing Function 


int oracle_date_str_to_struct(const char* value, date* 
{ 
const char* date, *tmp; 
char *start, *end, zDay[3], zMonth[4], zYear[3]; 
date = get_date(value); 
if(date == NULL) { 
fprintf(stderr, "Invalid date\n"); 
return -1; 


/* Find first '-' */ 

start = strchr(date,'-'); 

/* Find last '-' */ 

end = strchr(start-*1,'-'); 

/* Extract day part, convert to int*/ 
strncpy(zDay, date,2); 

zDay[2] = '\0'; 

d->day = atoi(zDay); 

/* Extract month part, convert to int*/ 
strncpy(zMonth, start+1,3); 

zMonth[3] = 0; 

tmp = uppercase(zMonth); 

d->month = month_num(tmp); 
free((void*)tmp); 

/* Extract year part, convert to int*/ 
strncpy(zYear, end+1,2); 

zYear[2] = '\0'; 

d->year = atoi(zYear); 
free((void*)date); 

return 0; 


Listing 7-17. The get date() Function 


#define ORACLE DATE REGEX "[0-9]{1,2}-[a-zA-Z]{3,3}-[0-9]{2,2}"; 
const char* get date(const char* value) 


{ 
pcre *re; 
const char *error, *pattern; 
int erroffset; 
int ovector[3]; 
int value_length; 
int rc, substring_length; 
char* result, *substring_start; 
pattern = ORACLE DATE REGEX; 
re = pcre compile( 
pattern, /* the pattern */ 
0, /* default options */ 
&error, /* for error message */ 
&erroffset, /* for error offset */ 
NULL); /* use default character tables */ 
/* Compilation failed */ 
if (re == NULL) { 
return NULL; 
} 
value_length = (int)strlen(value); 
rc = pcre_exec( 
re, /* the compiled pattern */ 
NULL, /* no extra data - we didn't study the pattern */ 
value, /* the value string */ 
value length, /* the length of the value */ 
O, /* start at offset © in the value */ 
0, /* default options */ 
ovector, /* output vector for substring information */ 
3); /* number of elements in the output vector */ 
if (rc < 0) { 
/* Match error */ 
return NULL; 
} 
/* Match succeded */ 
substring_start = (char*)value + ovector[0]; 
substring length = ovector[1] - ovector[0]; 
//printf("%.*s\n", substring length, substring start); 
result = malloc(substring_length+1); 
strncpy(result, substring_start, substring_length); 
result[substring length] = '\0'; 
return result; 
} 


测试 程序 


All three of the above functions work together to collate Oracle dates in chronological order. 
Our example program is shown in Listing 7-18. 


Listing 7-18. The Oracle Collation Test Program 


int main(int argc, char **argv) 


{ 


int rc; 

sqlite3 *db; 

char *sql; 

rc = sqlite3_open("test.db", &db); 

if(rc) { 
print_error(db, "Can't open database"); 
exit(1); 


/* Install oracle related date functions. */ 
install date functions(db); 
/* Register collating sequence. */ 
fprintf(stdout, "Registering collation sequence oracle daten"); 
sqglite3 create collation( db, "oracle date", 
SQLITE UTF8, db, 
oracle date collation ); 
/* Create dates table, add records. */ 
setup(db); 
/* Install date */ 
install date triggers(db); 
/* Turn SQL logging on. */ 
log sql(db, 1); 
/* Test default collation. */ 
fprintf(stdout, "Select records. Use default collation.\n"); 
sql = "select * from dates order by date"; 
print sql result(db, sql); 
/* Test Oracle collation. */ 
fprintf(stdout, "\nSelect records. Use Oracle data collation. Nn"); 
sql - "select * from dates order by date collate oracle date"; 
print sql result(db, sql); 
/* Get ISO Date from Oracle date. */ 
fprintf(stdout, "\nConvert Oracle date to ISO format.\n"); 
sql = "select iso from oradate('01-APR-05') as 'ISO Date'"; 
print sql result(db, sql); 
/* Validate Oracle date. */ 
fprintf(stdout, "\nValidate Oracle format. Should fail.\n"); 
sql = "select validate oradate('01-NOT-2005')"; 
execute(db, sql); 
/* Test Oracle date triggers. */ 
fprintf(stdout, "\nTest Oracle insert trigger -- should fail.\n"); 
sql = "insert into dates (date) values ('01-NOT-2005')"; 
execute(db, sql); 
fprintf(stdout, "\nTest Oracle update trigger -- should succeed.\n"); 
sql = "update dates set date='01-JAN-2005'"; 
execute(db, sql); 
print sql result(db, "select * from dates"); 
/* Done. */ 
sqlite3_close(db); 
return 0; 


第 8 章 语言 扩展 


SQLite 本 身 是 用 C 语 言 编写 的 ， 它 有 自己 的 C API。 但 是 ， 开 源 社区 中 提供 了 多 种 SQLite 的 扩 
展 ， 使 你 在 以 在 其 它 的 编程 语言 或 程序 库 中 存 取 SQLite 数 据 库 ， 如 Per、Python、Ruby、 


Java、Qt 和 ODBC。 在 很 多 情况 下 ， 每 种 编程 语言 可 以 有 几 个 扩展 可 供 选择 ， 这 些 扩展 由 不 
同 的 人 为 不 同 的 需求 而 编写 。 


空 注 : 我 只 在 其 它 地 方 看 了 Delphi 的 扩展 ， 本 章 基 本 没 看 。 


$93 SQLite 内 核 


本 章 是 SQLite 各 主要 子 系统 的 一 个 概览 。 它 的 灵感 来 自 一 次 会 议 上 Richard Hipp 对 SQLite 所 做 
的 介绍 。 即 使 你 没有 看 过 SQLite 的 源 代码 ， 你 也 会 发 现 这 些 内 容 是 如 此 的 有 趣 。 即 使 SQLite 
还 在 发 展 ， 但 本 章 所 介绍 的 概念 一 时 不 会 改变 。 


现在 ， 你 应 该 已 经 熟悉 SQLite 的 主要 组 件 了 。 第 1 章 有 一 个 概述 ， 第 5 章 介 绍 了 B-tree 和 
pager， 这 些 概 念 本 章 就 不 再 介绍 了 。 本 章 会 从 虚拟 机 入 手 ， 它 是 SQLite 的 心脏 ; 然后 是 存储 
E ; 最 后 是 编译 器 ， 它 可 能 是 系统 中 最 复杂 的 部 分 。 


虚拟 数据 库 引 擎 (VDBE) 


VDBE 是 SQLite 的 核心 ， 它 的 上 层 模 块 和 下 层 模 块 本 质 上 都 是 为 它 服务 的 ， 它 的 实现 位 于 
vbde.c、vdbe.h、vdbeapi.c、vdbelnt.h 和 vdbemem.c 等 几 个 文件 中 。 如 第 5 章 所 述 ， 一 个 语 
句 (statement) 会 编译 为 一 个 完整 的 VDBE 程 序 ， 执 行 一 条 单独 的 SQL 命 令 。 它 通过 底层 的 基础 
设施 B-tree 执 行 由 编译 器 (Compiler) 生 成 的 字 节 代码 ， 这 种 字 节 代码 程序 语言 是 为 了 进行 查 

询 、 读 取 和 修改 数据 库 而 专门 设计 的 。 


字 节 代码 在 内 存 中 被 封装 成 sqlite3_stmt 对 象 (内 部 叫做 Vdbe， 见 vdbelnt.h)，Vdbe( 或 者 说 
statement) 包 含 执行 程序 所 需要 的 一 切 ， 包 括 : 


。 VDBE 程 序 

e 程序 计数 器 

e 结果 字段 的 名 称 和 类 型 

e 参数 的 绑 定 值 

e 运行 栈 和 国定 数量 的 编号 的 内 在 单元 
e 其 它 的 运行 时 状态 信息 ， 如 B-tree 游 标 


VDBE 是 一 个 虚拟 机 ， 它 的 字 节 代码 指令 和 汇编 程序 十 分 类 似 ， 每 一 条 指令 由 操作 码 和 三 个 操 
作 数 构成 : «opcode, P1, P2, P3>。Opcode 为 一 定 功能 的 操作 码 ， 为 了 理解 ， 可 以 看 成 一 个 
函数 。p1 是 32 位 的 有 符号 整数 ，p2 是 31 位 的 无 符号 整数 ， 它 通常 是 跳 转 (jump) 指 令 的 目标 地 
址 (destination)， 当 然 还 有 其 它 用 途 ; p3 为 一 个 以 null 结 尾 的 字符 串 或 者 其 它 结构 体 的 指针 。 
目前 SQLite 中 有 128 个 操作 码 。 和 C API 不 同 的 是 ，VDBE 操 作 码 经 常 变化 ， 所 以 不 应 该 用 字 
节 码 编写 自己 的 程序 。 


下 面 的 几 个 C API 直 接 和 VDBE 交 互 : 


e sqlite3_bind_xxx() functions 


e sqlite3_step() 

e sqlite3_reset() 

e sqlite3_column_xxx() functions 
e sqlite3_finalize() 


一 般 情 况 下 ， 所 有 的 API 都 是 用 来 执行 一 个 查询 并 在 VDBE 相 关 的 结果 集中 步 进 操作 。 它 们 有 
一 个 共同 点 : 都 以 一 个 语句 句 酉 做 参数 。 这 是 因为 它们 都 需要 句 酉 中 的 VDBE 代 码 或 相关 资源 
来 完成 任务 。 注 意 : sqlite3_prepare() 工 作 于 开始 阶段 ， 用 于 产生 VDBE 代 码 ， 它 不 参与 执 

行 。 


所 有 SQL 命令 的 VDBE 程 序 都 可 以 通过 EXPLAIN 命 令 得 到 ， 如 


sqlite> .m col 

sqlite> .h on 

sqlite> .w 4 15 3 3 15 

sqlite> explain select * from episodes; 


addr opcode pi p2 p3 
0 Goto 0 12 
1 Integer 0 0 
2 OpenRead 0 2 # episodes 
3 SetNumColumns 9 3 
4 Rewind 9 10 
5 Recno 0 0 
6 Column 0 T 
7 Column 0 2 
8 Callback 3 0 
9 Next 0 5 
10 Close 0 0 
11 Halt 0 0 
12 Transaction 0 0 
13 VerifyCookie 0 10 
14 Goto 0 1 
15 Noop 0 0 
上 面 使 用 了 4 条 命令 ， 前 面 的 命令 用 于 调试 和 格式 化 。 另 外 ， 我 在 编译 SQLite 时 使 用 了 


SQLITE_DEBUG 选 项 ， 这 个 选择 可 以 提供 运行 栈 更 多 的 信息 ， 比 如 包含 在 p3 里 面 的 表 名 。 


空 注 : 当前 版 本 的 SQLite(3.6.18) 确 实 有 较 大 变化 ， 现 在 执行 EXPLAIN 命 令 的 结果 如 下 。 


addr opcode pi p2 p3 p4 p5 comment 
0 Trace 0 0 0 00 
al Goto 0 11 0 00 
2 OpenRead 0 2 0 3 00 
3 Rewind 0 9 0 00 
4 Rowid 0 1 0 00 
5 Column 0 1 2 00 
6 Column 0 2 3 00 
7 ResultRow 1 3 0 00 
8 Next 0 4 0 01 
9 Close 0 0 0 00 
10 Halt 0 0 0 00 
11 Transaction 0 0 0 00 
12 VerifyCookie 0 40 0 00 
13 TableLock 0 2 0 episodes 00 
14 Goto 0 2 0 00 


空 注 : 有 关 VDBE 的 最 详细 参考 在 vbde.c 中 ， 也 可 以 参考 SQLite 网 站 提供 的 文档 
http://www.sqlite.org/opcode.html ° 


空 注 : 后 面 的 内 容 还 按 原 文 翻译 。 


# (Stack) 


一 个 VDBE 程 序 通常 由 几 个 完成 特定 任务 的 段 (section) 构 成 ， 每 一 个 段 中 都 有 一 些 操作 栈 的 指 
令 。 这 么 做 是 因为 不 同 的 指令 有 不 同 数量 的 和 参数， 有些 指令 只 有 一 个 参数 ; 有 些 指令 没有 参 
数 ; 有 些 指令 有 好 几 个 参数 ， 这 时 三 个 操作 数 就 不 够 了 。 


考虑 到 这 些 情况 ， 指 令 采 用 栈 来 传递 参数 。 而 这 些 指令 本 身 不 会 做 这 些 工作 ， 所 以 在 它们 之 
前 需要 其 它 一 些 指令 的 帮助 ， 以 取得 需要 的 参数 。VDBE 把 计算 的 中 间 结 果 保 存 到 内 存单 元 
(memory cell) 中 ， 其 实 堆栈 和 内 存单 元 都 基于 Mem 结 构 ( 见 vdbelnt.h)。 


程序 体 
让 我 们 来 看 前 面 打 开 episodes 表 的 例子 。 它 的 第 一 个 段 主 要 包括 指令 1~3。 


第 一 条 指令 (Integer) 是 为 第 二 条 指令 作 准 备 的， 也 就 是 把 第 二 条 指令 执行 需要 的 参数 压 入 堆 
栈 ，OpenRead 从 堆栈 中 取出 参数 值 然后 执行 。 


SQLite 可 以 通过 ATTACH 命 令 在 一 个 连接 中 打开 多 个 数据 库 文 件 ， 每 当 SQLite 打 开 一 个 数据 
库 ， 它 就 为 之 赋 一 个 索引 号 (index)， 主 数据 库 的 索引 为 0， 附 加 的 第 一 个 数据 库 为 1， 依 次 类 
推 。Integer 指 令 将 数据 库 索 引 的 值 压 入 栈 (本 例 为 0， 代 表 主 数据 库 )， 而 OpenRead 从 中 取出 
值 ， 并 决定 操作 哪个 数据 库 。 它 用 P2 来 确定 需要 打开 表 的 根 页 (root page)。 然 后 它 打开 一 个 
指定 数据 库 中 指定 表 的 B-tree 游 标 。 所 有 这 些 在 VDBE 代 码 文档 中 都 有 解释 ， 例 如 ， 
OpenRead 命 令 在 SQLite 文 档 中 的 解释 如 下 : 


为 数据 库 表 打开 一 个 只 读 游标 ， 这 个 表 的 根 页 在 数据 库 文 件 的 P2 处 。 数 据 库 文件 由 栈 顶 的 一 
个 整数 指定 。0 表 示 主 数据 库 ，1 表 示 用 于 存放 临时 表 的 数据 库 。 新 打开 游标 的 标识 符 在 P1 
中 。P1 的 值 不 必 是 相 邻 的 ， 但 应 该 是 一 个 小 整数 。 如 果 其 值 为 负 ， 表 示 错 误 。If P2==0 then 
take the root page number from off of the stack. 


只 要 有 游标 打开 ， 就 会 有 一 个 读 锁 加载 到 数据 库 上 。 如 果 数 据 库 本 来 是 未 加 锁 的 ， 此 命令 的 
部 分 工作 包括 获得 一 个 读 锁 。 读 锁 允 许 其 它 进 程 读数 据 库 ， 但 是 禁止 任何 进程 改 数据 库 。 读 
锁 在 所 有 游标 都 关闭 时 释放 。 如 果 此 指令 在 申请 读 锁 时 失败 ， 程 序 结束 并 返回 SQLITE_BUSY 
错误 码 。 


P3 的 值 是 指向 一 个 结构 的 指针 ， 该 结构 定义 索引 的 内 容 和 排序 序列 的 关键 信息 。 当 不 指向 索 
引 时 ，P3 的 内 容 为 空 。 


这 个 关于 OpenRead 的 文档 与 其 它 指令 的 文档 一 样 ， 可 以 直接 在 源 程序 文件 中 找到 ， 特 别 是 
vdbe.c 中 。 


最 终 ，SetNumColumns 指 令 设 置 游标 需要 处 理 的 列 的 数量 ， 这 是 由 所 要 处 理 的 表 和 包含 的 列 数 
决定 的 。P1 为 游标 的 索引 (这 里 为 0， 是 刚刚 打开 的 游标 的 索引 号 )。P2 为 列 的 数目 ，episodes 
表 有 三 列 。 


继续 本 例 ，Rewind 指 令 将 游标 设置 到 表 的 开始 ， 它 会 检查 表 是 否 为 空 (" 空 " 即 没有 记录 )。 如 果 
没有 记录 ， 它 会 导致 指令 指针 跳 转 到 P2 指 定 的 指令 处 。 此 处 P2 为 10， 即 Close 指 令 。 一 旦 
Rewind 设 置 游标 ， 接 下 来 就 会 执行 下 一 段 (指令 5~9) 的 几 条 指令 。 它 们 的 主要 功能 是 遍历 结果 
集 ，Recno 把 由 游标 P1 指 定 的 记录 的 关键 字段 值 压 入 堆栈 。Column 指 令 从 由 P1 指 定 的 游标 ， 
P2 指 定 的 列 取 值 。5,6,7 三 条 指令 分 别 把 id(primary key)、season 和 name 字 段 (游标 0 所 指明 的 
表 episodes 的 全 部 3 个 字段 ) 的 值 压 入 栈 。 接 下 来 ，Callback 指 令 从 栈 中 取出 三 个 值 (由 P1 指 
定 )， 然 后 形成 一 个 记录 数组 ， 存 储 在 内 存单 元 (memory cell) 中 。 然 后 ，Callback 会 挂 起 
VDBE 的 执行 ， 把 控制 权 交 给 sqlite3_step()， 该 函数 将 返回 SQLITE_ROW 。 


addr opcode pl p2 p3 
0 Goto 0 12 
1 Integer 0 0 
2 OpenRead 0 2 & episodes -4— Open table 
3 Set NumCo lumns 0 
一 4 Rewind e ia) Position cursor 
2 5 Recno 8 8 
G 6 Column 0 1 Step through records 
>| 7 Column 9 2 
= 8 Callback 3 0 
€ 9 Next 8 5 
= [10 Close 8 6 t— Close table 
»11 Halt . 8 0 --- End program 
12 Transaction 8 8 
13 VerifyCockie 8 18 
l4 Goto 8 1 
15 Noop Q Q 


图 9-1 VDBE4) 44% : Open 和 Read 


— 9 VDBE | & T it RA (4A FA X T 4) (statement) 4) 48) > PRA AA it 
sqlite3_column_xxx() 函数 从 记录 结构 内 取出 字段 值 。 当 下 次 调用 sqlite3_step() 时 ， 指 令 指 针 
会 指向 Next 指 令 。Next 指 令 会 把 游标 移 向 表 的 下 一 行 ， 如 果 有 其 它 的 记录 ， 它 会 跳 到 由 P2 指 
定 的 指令 ， 在 这 里 为 指令 5(Recno 指 令 )， 创 建 一 个 新 的 记录 结构 ， 进 入 下 一 次 循环 。 如 果 已 
经 没有 其 它 记录 可 读 ，Next 不 跳 转 ， 而 是 执行 下 一 条 指令 ， 这 里 是 Close 指 令 。Close 指 令 会 
关闭 游标 ， 然 后 执行 Halt 指 令 ， 结 束 VDBE 程 序 ， 并 且 sqlite3_step() 函 数 会 返回 
SQLITE_DONE 。 


程序 开始 与 停止 


前 面 介 绍 了 程序 的 核心 部 分 ， 现 在 来 看 看 其 余 的 指令 ， 这 些 指令 与 启动 和 初始 化 有 关 ， 见 图 9- 
2。 第 一 条 指令 是 Goto 指 令 ， 它 是 一 条 跳 转 指 令 ， 跳 到 P2 处 ， 本 例 中 是 跳 到 第 12 条 指令 。 


指令 12 是 Transaction， 它 开始 一 个 新 的 事务 ; 然后 执行 下 一 条 指令 VerifyCookie， 它 的 主要 功 
能 是 确定 VDBE 程 序 编译 后 ， 数 据 库 sSchema 是 否 改变 ( 即 是 否 进行 过 更 新 操作 )。 这 在 SQLite 
中 是 一 个 很 重要 的 概念 ， 在 SQL 被 sqlite3_prepare() 编 译 成 VDBE 代 码 至 程序 调用 
sqlite3_step() 执 行 字 节 码 的 这 段 时 间 内 ， 另 一 个 SQL 命令 可 能 会 改变 数据 库 模式 (比如 ALTER 
TABLE ` DROP TABLE 或 CREATE TABLE)。 一 旦 发 生 这 种 情况 ，schema 版 本 就 会 改变 ， 之 
前 编译 的 语句 (statement) 就 会 变 得 无 效 。 当 前 的 数据 库 schema 信 息 记 录 在 数据 库 文件 的 根 页 
中 。 类 似 地 ， 每 个 语句 都 有 一 份 用 于 比较 的 在 编译 时 刻 该 模式 的 备份 ，VerifyCookie 的 功能 就 
是 检查 它们 是 否 匹配 ， 如 果 不 匹 配 ， 就 要 采取 适当 的 措施 。 








addr opcode pl p2 p3 
r—9 Goto 9—— Hn -4- Gato 12 
| »1 Integer 0 0 
2 Op enRead 0 2 # episodes 
3 Se tNumC olum s 8 3 
4 Rewind ð 18 
5 Recno 8 ð 
6 Colum 9 l 
7 Colum Q 2 
8 Callback 3 9 
9 Ne xt 0 5 
10 Close 0 0 
11 Halt 0 0 
—» 12 Transaction 0 0 Begin transaction. 
13 VerifyCookie 0 18 -«— Check schema 
Goto instruction 1 





15 No op 


© 
© 


图 9-2 VDBE 的 步骤 : 程序 开始 


语句 的 版 本 号 由 VerifyCookie 的 P2 参 数 指定 ， 将 它 与 磁盘 上 的 数据 库 Schema 版 本 号 进行 比 
较 。 如 果 schema 没 有 改变 ， 两 个 版 本 号 应 该 一 致 。 如 果 不 一 致 ， 则 VDBE 程 序 失 效 。 在 此 情 
况 下 ，VerifyCookie 将 会 终止 程序 并 返回 SQLITE_SCHEMA 错 误 。 在 此 情况 下 ， 应 用 程序 需 
要 重新 编译 SQL 语句 ， 基 于 新 的 Schema 版 本 生成 新 的 VDBE 程 序 。 


如 果 两 者 匹配 ， 会 执行 下 一 条 指令 Goto ; 它 会 跳 到 程序 的 主要 部 分 ， 即 第 一 条 指令 ， 打 开 表 
读 取 记录 。 这 里 有 两 点 值得 注意 : 


(1)Transaction 指 令 本 身 不 会 获取 锁 。 它 的 功能 相当 于 BEGIN， 而 共享 锁 实 际 是 由 OpenRead 
指令 获取 的 。 当 事务 关闭 时 释放 锁 ， 由 Halt 指 令 完 成 ， 它 会 进行 扫尾 工作 。 


(2) 语句 对 象 (VDBE 程 序 ) 所 需 的 存储 空间 在 程序 执行 前 就 已 经 确定 。 这 缘 于 两 个 重要 事实 : 首 
先 ， BUE 不 会 比 指令 的 数目 还 多 。 其 次 ， 内 存单 元 (memory cell) 的 数量 永远 不 会 多 于 指 
令 的 数量 (通常 少 得 多 )。 在 执行 VDBE 程 序 之 前 ，SQLite 可 以 计算 出 分 配 资源 所 需要 的 内 存 。 


指令 的 类 型 


VDBE 同 时 只 会 执行 一 条 指令 。 每 条 指令 都 完成 一 项 简单 的 任务 ， 而 且 通 常 和 该 指令 前 面 、 后 
面 的 指令 有 关 。 大 体 上 来 说 ， 指 令 可 分 为 三 类 : 


(1) 处 理 值 : 这 些 指令 通常 完成 算术 运算 ， 比 如 加 、 减 和 除 BHM begi 还 有 字 
符 囊 操作 。 


ee dy un 内 存 指令 进行 栈 操作 或 者 在 内 存单 元 之 
间 传 递 数 据 。 磁 盘 操 作 指令 控制 B-tree 和 pager 打 开 或 操作 游标 ， 开 始 或 结束 事务 ， 等 等 。 


(3) 流 程控 制 : 控制 指令 主要 是 有 条 件 地 或 无 条 件 地 移动 指令 指针 。 


一 旦 熟悉 了 指令 集 ， 就 不 难 明 白 VDBE 程 序 是 如 何 工 作 的 。 至 少 你 可 以 了 解 如 何 使 用 栈 来 为 后 
面 指令 的 执行 做 准备 。 


B-Tree 和 Pager 模 型 


B-tree 使 VDBE 执 行 查找 、 插 入 和 删除 的 效率 达到 O(logN)， 以 及 在 O(1) 的 效率 下 双向 遍历 结 
果 集 。 它 是 自 平 衡 的 ， 可 自动 地 执行 碎片 整理 和 空间 回收 。B-tree 本 身 不 会 直接 读 写 磁盘 ， 它 
仅仅 维护 着 页 (page) 之 间 的 关系 。 当 B-tree 需 要 页 或 者 修改 页 时 ， 它 就 会 调用 pager。 当 修改 
页 时 ，pager 保 证 原始 页 首先 写 入 日 志文 件 。 当 它 完成 写 操作 时 ，pager 根 据 事务 状态 决定 如 
何 做 。 


数据 库 文 件 格式 


数据 库 中 所 有 的 页 从 1 开始 顺序 编号 。 一 个 数据 库 由 多 个 多 重 B-tree 构 成 一 B-tree 用 于 每 一 
个 表 和 索引 。 每 个 表 和 索引 的 第 1 个 页 (地 址 ) 称 为 根 页 。 所 有 表 和 索引 的 根 页 都 存储 在 
sqlite_ master 表 中 。 


ppt uu m 
特殊 文件 头 。 它 包括 库 的 版 本 、 格 式 的 版 本 、 页 大 小 、 编 码 等 所 有 创建 数据 库 时 设置 的 永久 
性 和 参数。 有关 这 个 特殊 文件 头 的 文档 在 btree. ' page 1 也 是 sqlite_master 表 的 根 页 


页 重用 及 回收 


SQLite 利 用 一 个 空闲 页 链表 (free list) 完 成 页 的 循环 使 用 。 当 一 个 页 的 所 有 记录 都 被 删除 时 ， 
就 被 插入 到 该 链表 。 当 有 新 信息 需要 进入 数据 库 时 ， 临 近 的 空闲 页 先 被 选中 ， 当 没有 空闲 页 
时 ， 才 创建 新 的 页 (会 增加 文件 的 大 小 )。 当 运行 VACUUM 命令 时 ， 会 清空 空闲 页 链表 ， 所 以 数 
据 库 会 缩小 。 本 质 上 它 是 在 新 的 文件 中 重新 建立 数据 库 ， 而 所 正 使 用 的 页 都 被 拷贝 过 去 ， 而 

空闲 页 链表 不 拷 ， 结 果 就 是 一 个 新 的 ， 变 小 了 的 数据 库 。 当 数据 库 的 autovacuum 开 启 时 ， 
SQLite 不 会 使 用 空闲 页 链表 ， 而 且 在 每 一 次 事务 提交 时 自动 压缩 数据 库 。 


B-Treei2 i 


B-tree 中 的 页 由 B-tree 记 录 组 成 ， 也 叫做 payload( 有 效 载 荷 )。 每 一 个 B-tree 记 录 ( 或 payload) 有 
两 个 域 : 关键 字 域 (key field) 和 数据 域 (data field)。 关 键 字 域 就 是 ROWID 的 值 ， 也 就 是 每 个 数 
据 库 表 都 会 提供 的 关键 字 的 值 。 从 B-tree 的 角度 ， 数 据 域 可 以 是 任何 无 结构 的 数据 。 数 据 库 的 
记录 就 保存 在 这 些 数 据 域 中 。B-tree 的 任务 就 是 排序 和 遍历 ， 这 仅 需 要 关键 字段 。Payload 的 
大 小 是 不 定 的 ， 这 与 内 部 的 关键 字 和 数据 域 有 关 。 平 均 情况 下 ， 每 个 页 一 般 包含 多 个 
payload， 当 然 也 可 能 一 个 payload 占 用 几 个 页 ( 当 一 个 payload 太 大 不 能 存在 一 个 页 内 )。 


B+it 


B-tree 按 关键 字 的 顺序 存储 ， 在 一 个 B-tree 中 所 有 的 关键 字 必 须 唯一 (这 一 点 自动 地 由 ROWID 
主键 字段 保证 )。 表 采用 Bttree ，B+tree 的 内 部 结 点 不 包含 表 数据 (数据 库 记 录 )。 图 9-3 是 一 个 
表 的 Bttree 的 示例 : 


Root Page 
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图 9-3 B+tree a4 2122 C) 


B+tree T 4) 4k Xt (root page)» A 31 3t (internal page) 都 是 用 来 导航 的 ， 这 些 页 的 数据 域 都 是 指 

向 下 级 页 的 指针 ， 仅 仅 包含 关键 字 。 所 有 的 数据 库 记 录 都 存储 在 叶子 页 (leaf page) 内 。 在 叶 节 
点 一 级 ， 记 录 和 页 都 是 按照 关键 字 的 顺序 排列 的 ， 这 使 B-tree 游 标 只 使 用 页 结 点 就 能 正 向 和 反 
向 (水 平地 ) 遍 历 记 录 ， 并 使 遍历 的 效率 (时 间 复 杂 度 ) 可 能 达到 O(1) © 


记录 和 字段 


数据 库 记 录 位 于 叶子 页 的 数据 域 ， 由 VDBE 管 理 ( 前 面 在 介绍 Callback 命 令 时 介绍 过 )。 数 据 库 
记录 以 二 进 制 的 形式 存储 ， 但 有 一 定 的 数据 格式 ， 这 种 格式 描述 了 记录 中 的 所 有 字段 。 记 录 
格式 是 连续 的 字 节 流 ， 其 组 成 包括 一 个 逻辑 头 (logical header) 和 一 个 数据 区 (data segment) > 
逻辑 头 包括 “ 头 大 小 (可 变 长 的 64 位 整数 和 一 个 数据 类 型 (也 是 可 变 长 的 64 位 整数 ) 数 组 ， 数 据 
类 型 用 来 描述 存储 在 数据 区 的 字段 的 类 型 ， 如 图 9-4 所 示 。64 位 整数 用 Huffman 编 码 实 现 。 


B-Tree VDBE 


| hsize LTI |T2 | T3 | TNR D1 | D2 | D3 | DN. 





图 9-4 记录 结构 


类 型 入 口 的 数量 与 字段 数量 相等 。 类 型 数组 与 字段 数组 的 元 素 按 下 标 相 对 应 。 一 个 类 型 入 口 
表明 它 对 应 字段 的 数据 类 型 和 宽度 。 类 型 入 口 的 可 能 取 值 及 其 含义 在 表 9-1 中 列 出 。 


表 9-1 字段 类 型 值 


类 型 值 含义 数据 宽度 

0 NULL 0 

N in 1..4 有 符号 整数 N 

5 有 符号 整数 6 

6 有 符号 整数 8 

7 IEEE 符 点 数 8 

8-11 未 使 用 N/A 

N>12 的 偶数 BLOB (N-12)/2 
N>13 的 奇数 TEXT (N-13)/2 


例如 ， 取 episodes 表 的 第 1 条 记录 : 


sqlite> SELECT * FROM episodes ORDER BY id LIMIT 1; 
id season name 
0 1 Good News Bad News 


这 条 记录 的 内 部 记录 格式 如 图 9-5 所 示 。 
,04 101 |01 |49 00/01 | Good News Bad News | 
表 9-5 episodes 表 的 第 1 条 记录 


记录 头 长 4 字 节 。 头 的 大 小 反映 头 内 各 要 素 都 是 单字 节 编码 。 第 一 个 类 型 ， 对 应 id 字段 ， 是 一 
个 1 字 节 有 符号 整数 。 第 二 个 类 型 ， 对 应 season 字 段 ， 也 是 一 个 1 字 节 有 符号 整数 。Name 字 
段 的 类 型 入 口 是 一 个 大 于 13 的 奇数 ， 表 示 它 是 一 个 text 值 ， 该 值 占 (49-13)/2=18 个 字 节 。 通 过 
这 些 信息 ，VDBE 可 以 解析 记录 的 数据 段 并 取出 独立 的 字段 值 。 


层次 数据 组 织 


SQLite 的 层次 数据 组 织 模型 如 图 9-6 所 示 。 在 模型 中 ， 每 层 处 理 特定 的 数据 单元 。 从 下 向 上 ， 
数据 越 来 越 结构 化 ; 从 上 往 下 ， 数 据 越 来 越 无 序 。C-API 处 理 字 段 值 ， VDBE 处 理 记 录 ，B- 
tree 处 理 健 值 的 数据 ，pager 处 理 页 ，OS 接 口 处 理 二 进 制 的 数据 和 原始 存储 器 。 





C API Fields 
sqlite3_column_text(stmt, 2) 
Records 
Payloads 
Pages 
OS Interface Binary data 
Database file Storage 


图 9-6 模型 和 各 层 所 对 应 的 数据 


Each module takes part in managing its own specific portion of the data in the database, and 
relies on the layer below it to supply it with a more crude form from which to extract its 
respective pieces. 

溢出 页 
如 前 所 述 ，B-tree 记 录 具 有 可 变 的 大 小 ， 而 页 的 大 小 是 国定 的 。 这 就 有 可 能 一 个 B-tree 记 录 比 
一 个 单独 的 页 还 要 大 。 这 时 ， 超 大 的 B-tree 记 录 就 溢出 到 由 溢出 页 组 成 的 链表 上 ， 如 图 9-7 所 
示 。 


在 图 中 ， 第 4 个 页 太 大 ，B-tree 模 块 就 创建 一 个 溢出 页 来 容纳 它 。 如 果 一 个 溢出 页 还 不 够 ， 就 

再 链接 第 2 个 。 这 实际 上 也 是 二 进 制 大 对 象 的 处 理 方 法 。 请 记 住 : 当 你 使 用 大 的 BLOB 时 ， 它 

实际 上 是 存储 在 页 链表 中 的 。 如 果 BLOB 实 在 太 大 ， 链 表 就 会 很 长 ， 操 作 就 会 很 低 效 。 这 种 情 
况 下 ， 将 BLOB 存 储 在 一 个 外 部 文件 中 而 在 数据 库 中 只 保存 其 文件 名 也 许 更 好 一 些 。 














Overflow Page 


Overflow Page 


图 9-7 溢出 页 


B-Tree API 


B-Tree 模 块 有 它 自己 的 API， 它 可 以 独立 于 C API| 使 用 。 也 就 是 说 ， 如 果 你 愿意 ， 你 可 以 把 它 
当 作 一 个 独立 的 运行 库 来 使 用 ， 或 在 SQLite 中 直接 存 取 库 表 。SQLite B-tree 模 块 的 另 一 个 好 
处 就 是 它 本 身 支持 事务 。 由 pager 处 理 的 事务 、 锁 和 日 志 都 是 为 B-tree 服 务 的 。 根 据 功 能 ， 可 
将 B-Tree API 分 为 以 下 几 类 : 
访问 和 事务 函数 
包括 : 

e sqlite3BtreeOpen: 打开 一 个 新 的 数据 库 文件 ， 返 回 一 个 B-tree 对 象 。 

e sqlite3BtreeClose: 关闭 一 个 数据 库 。 

。 sqlite3BtreeBeginTrans: 开始 一 个 新 的 事务 。 

e sqlite3BtreeCommit: 提交 当前 事务 。 

e sqlite3BtreeRollback: 回 卷 当 前 事务 。 

e sqlite3BtreeBeginStmt: 开始 一 个 statement 事 务 。 

e sqlite3BtreeCommitStmt: 提交 一 个 statement 事 务 。 


e sqlite3BtreeRollbackStmt: 回 卷 一 个 statement 事 务 。 


包括 : 


e sqlite3BtreeCreateTable: 在 数据 库 文 件 中 创建 一 个 新 的 、 空 的 B-tree。 其 参数 决定 是 采 
用 表格 式 (B+tree) 还 是 索引 格式 (B-tree)。 


e sqlite3BtreeDropTable: 从 数据 库 中 删除 一 个 B-tree。 


。 sqlite3BtreeClearTable: 从 B-tree 中 删除 所 有 数据 ， 但 保持 B-tree 的 结构 。 


游标 函数 
包括 : 


e sqlite3BtreeCursor: Creates a new cursor pointing to a particular B-tree. Cursors can be 
either a read cursor or a write cursor. Read and write cursors may not exist in the same 
B-tree at the same time. 


e sqlite3BtreeCloseCursor: Closes the B-tree cursor. 
e sqlite3BtreeFirst: Moves the cursor to the first element in a B-tree. 
e sqlite3BtreeLast: Moves the cursor to the last element in a B-tree. 


e sqlite3BtreeNext: Moves the cursor to the next element after the one it is currently 
pointing to. 


e sqlite3BtreePrevious: Moves the cursor to the previous element before the one it is 
currently pointing to. 


e sqlite3BtreeMoveto: Moves the cursor to an element that matches the key value passed 
in as a parameter. If there is no match, leaves the cursor pointing to an element that 
would be on either side of the matching element, had it existed. 


TO Kk E BL 
包括 : 
e sqlite3BtreeDelete: Deletes the record that the cursor is pointing to. 
e sqlite3Btreelnsert: Inserts a new element in the appropriate place of the B-tree. 


e sqlite3BtreeKeySize: Returns the number of bytes in the key of the record that the 
cursor is pointing to. 


e sqlite3BtreeKey: Returns the key of the record the cursor is currently pointing to. 


e sqlite3BtreeDataSize: Returns the number of bytes in the data record that the cursor is 
currently pointing to. 


e sqlite3BtreeData: Returns the data in the record the cursor is currently pointing to. 


配置 水 数 
包括 : 


e sqlite3BtreeSetCacheSize: Controls the page cache size as well as the synchronous 
writes (as defined in the synchronous pragma). 


e sqlite3BtreeSetSafetyLevel: Changes the way data is synced to disk in order to increase 
or decrease how well the database resists damage due to OS crashes and power 
failures. Level 1 is the same as asynchronous (no syncs() occur and there is a high 
probability of damage). This is the equivalent to pragma synchronous=OFF. Level 2 is 
the default. There is a very low but non-zero probability of damage. This is the 
equivalent to pragma synchronous=NORMAL. Level 3 reduces the probability of 
damage to near zero but with a write performance reduction. This is the equivalent to 
pragma synchronous=F ULL. 


sqlite3BtreeSetPageSize: Sets the database page size. 


sqlite3BtreeGetPageSize: Returns the database page size. 


sqlite3BtreeSetAutoVacuum: Sets the autovacuum property of the database. 


sqlite3BtreeGetAutoVacuum: Returns whether the database uses autovacuum. 
e sqlite3BtreeSetBusyHandler: Sets the busy handler. 


还 有 其 它 的 函数 ， 所 有 这 些 函 数 在 btree.h 和 btree.c 中 都 有 很 完备 的 文档 ， 但 上 面 列 出 的 函数 
可 以 使 你 建立 一 个 总 体 印 象 。 


编译 ds 


前 面 已 经 介绍 了 VDBE 以 下 直到 OS 层 的 各 层次 。 DE E 怎么 来 的 。 编 译 器 的 输 
入 是 一 个 单独 的 SQL 命令 ， 输 出 是 最 终 经 过 优化 的 VDBE 和 程序， 这些 工 作 在 3 个 阶段 上 完成 : 
分 词 器 (Tokenizer)、 分 析 器 (Parsen 和 代码 生成 器 (Code Generator) ° 


41 14 8$ (Tokenizer) 


编译 的 第 一 步 是 对 SQL 命令 分 词 。 分 词 器 将 一 个 命令 分 解 成 一 串 单独 的 词汇 (token)。 词 可 以 
是 有 特定 含义 的 一 个 字符 或 一 个 字符 序列 。 每 个 词 都 有 其 关联 的 词类 (token class)， 词 类 是 一 
个 数字 标识 ， 表 明 这 个 词 是 什么 。 例 如 左 括 号 的 词类 是 TK_LP， 保 留 字 SELECT 的 词类 是 
TK_SELECT。 所 有 词类 在 parse.h 中 定义 。 例 如 下 面 的 SQL 语 名 : 


SELECT rowid FROM foo where name='bar' LIMIT 1 ORDER BY rowid; 


经 分 词 器 处 理 之 后 的 部 分 结果 在 表 9-2 中 给 出 。 


表 9-2 一 个 分 词 后 SELECT 语 儿 


文本 词类 动作 
SELECT TK_SELECT 发 给 分 析 器 
re TK_SPACE 丢弃 
Rowid TK_ID 发 给 分 析 器 
re TK_SPACE 丢弃 
FROM TK_FROM 发 给 分 析 器 
ia TK_SPACE 丢弃 
foo TK_ID 发 给 分 析 器 
us TK SPACE 丢弃 
WHERE TK_WHERE 发 给 分 析 器 
ded TK SPACE 丢弃 
name TK_ID 发 给 分 析 器 
= TK_EQ 发 给 分 析 器 


> ， 分 词 器 按照 SQL 的 词法 定义 把 它 切 分 为 一 个 一 个 的 词 ， 并 传递 给 分 析 器 (Parser) 进 行 语 


保留 字 


分 词 器 是 手工 编写 的 (hand-coded)， 主 要 在 Tokenize.c 中 实现 。 因 为 是 手工 代码 ， 不 是 用 自动 
生成 的 代码 来 对 SQL 保留 字 分 类 。 保 留 字 在 keywordhash.h 文 件 中 定义 。 这 个 文件 是 一 个 最 优 
化 的 、 将 所 有 SQL 保 留 字 压 缩 到 可 能 最 小 的 缓冲 区 ， 方 法 是 公共 的 字符 序列 重 有 存放 。 
SQLite 使 用 指明 了 每 个 保留 字 偏 移 量 和 大 小 的 数组 来 识别 保留 字 入 口 。 这 种 方法 是 一 种 空间 
优化 的 方法 ， 有 利于 内 诅 式 的 应 用 程序 。 一 个 生成 了 的 缓冲 区 的 例子 如 下 : 


static int keywordCode(const char *z, int n)f{ 

static const char zText[537] = 
"ABORTABLEFTEMPORARYADDATABASELECTHENDEFAULTRANSACTIONATURALTER" 
"AISEACHECKEYAFTEREFERENCESCAPELSEXCEPTRIGGEREGEXPLAINITIALLYANALYZE" 
"XCLUSIVEXISTSTATEMENTANDEFERRABLEATTACHAVINGLOBEFOREIGNOREINDEX" 
"AUTOINCREMENTBEGINNERENAMEBETWEENOTNULLIKEBYCASCADEFERREDELETE" 
"CASECASTCOLLATECOLUMNCOMMITCONFLICTCONSTRAINTERSECTCREATECROSS" 
"CURRENT DATECURRENT TIMESTAMPLANDESCDETACHDISTINCTDROPRAGMATCH" 
"FAILIMITFROMFULLGROUPDATEIFIMMEDIATEINSERTINSTEADINTOFFSETISNULL" 
" JOINORDEREPLACEOUTERESTRICTPRIMARYQUERYRIGHTROLLBACKROWHENUNION" 
"UNIQUEUSINGVACUUMVALUESVIEWHERE" ; 


The keywordhash.h file includes a routine sqlite3KeywordCode(), which allows the tokenizer 
to quickly match the keyword with its appropriate token class with minimal space. So, the 
tokenizer first tries to match a token with what it knows, and failing that, it resorts to 
sglite3KeywordCode(), which will return either a keyword token class or a generic TK ID. 


The tokenizer and parser work hand in hand, one token at a time. As the tokenizer resolves 
each token, it passes the token to the parser. The parser takes the tokens and builds a 
parse tree, which is a hierarchical representation of the statement. 


TH ss (Parser) 


SQLite 的 语法 分 析 器 是 用 Lemon 生 成 的 (Lemon 是 一 个 开源 的 LALR(1) 语 法 分 析 器 的 生成 器 ， 
SQLite 在 使 用 时 进行 了 定制 )。 该 分 析 器 用 parse.c 内 定义 的 语法 规则 将 一 串 词 组 织 成 层次 结构 
的 分 析 树 (parse tree) ° 


The parse tree is primarily composed of expressions and lists of expressions. An expression 
itself is a recursive structure that can contain subexpressions under it. For example, the 
WHERE clause in a SELECT parse tree is represented by a single expression. The SELECT 
clause, on the other hand, is represented as a list of expressions; each expression is a 
column that will be returned in the result set. 4] 42 > ta F f ŽI SQL 4) : 


SELECT rowid, name, season FROM episodes WHERE rowid=1 LIMIT 1 


可 以 组 织 成 如 图 9-8 所 示 的 分 析 树 。 


SELECT 


Result List 


rowid name season 


Source List 
episodes 


Where Expression 
eq 


ac a 


rowid 1 


Result List 


rowid name season 
limit (1) 
offset (0) 
图 9-8 简化 了 的 分 析 树 


一 旦 语句 经 过 分 词 和 分 析 ， 分 析 树 作为 一 种 结果 会 传送 给 代码 生成 器 。 


代码 生成 器 (Code Generator) 


代码 生成 器 是 SQLite 中 最 庞大 、 最 复杂 的 部 分 。 与 其 它 模 块 不 同 ， 代 码 生 成 器 没有 定义 明确 
的 接口 ， 但 它 与 分 析 器 关系 紧密 。 代 码 生 成 器 由 多 个 源 文 件 组 成 ， 这 些 源 文件 大 多 针对 特定 
的 SQL 操作 。 例 如 ， 生 成 SELECT 语句 的 代码 在 select.c 中 ， 其 它 的 源 文 件 包括 update.c、 
insert.c、delete.c 和 trigger.c 等 等 。 


代码 生成 器 根据 语法 分 析 树 生成 VDBE 程 序 。 树 的 每 一 部 分 生成 一 个 VDBE 指 令 序 列 来 完成 特 
定 的 任务 。The values for the operands are taken from the data structures associated with 
the parse tree. 例如 ， 下 面 是 一 个 读 操作 中 打开 表 的 代码 的 生成 实现 : 


/* Generate code that will open a table for reading.*/ 
void sqlite30penTableForReading( 


Vdbe *v, /* Generate code into this VDBE */ 
int iCur, /* The cursor number of the table */ 
Table *pTab /* The table to be opened */ 

){ 


sqlite3VdbeAddOp(v, OP Integer, pTab->iDb, 0); 
sqlite3VdbeAddOp(v, OP OpenRead, iCur, pTab->tnum); 
VdbeComment((v, "£ 96s", pTab->zName) ); 
sqlite3VdbeAddOp(v, OP SetNumColumns, iCur, pTab->nCol); 


Sqlite3vdbeAddOp HHA — 4 4X : (1)VDBE 实 例 ( 它 将 添加 指令 )，(2) 操 作 码 (一 条 指令 )， 
(3) 两 个 操作 数 。 它 增加 一 条 指令 到 VDBE 程 序 。 上 例 中 ，sqlite3OpenTableForReading 增 加 了 
3 条 指令 ， 即 图 9-1 中 的 指令 1~3， 功 能 是 打开 一 个 表 的 B-tree 用 于 读 。 为 方便 起 见 ， 将 图 9-1 中 
的 指令 序列 重 列 于 此 : 


sqlite> explain select * from episodes; 


addr opcode pi p2 p3 
0 Goto 0 12 

1 Integer 0 0 

2 OpenRead 0 2 # episodes 
3 SetNumColumns 9 3 

4 Rewind 9 10 

5 Recno 0 0 

6 Column 0 s 

7 Column 0 2 

8 Callback 3 0 

9 Next 0 5 

10 Close 0 0 

11 Halt 0 0 

12 Transaction 0 0 

13 VerifyCookie 0 10 

14 Goto 0 1 

15 Noop 0 0 


优化 


代码 生成 器 不 仅 负责 生成 代码 ， 也 负责 进行 查询 优化 。 优 化 是 代码 生成 的 一 部 分 ， 主 要 的 实 
现 位 于 where.c 中 。 生 成 的 WHERE 子 名 通常 被 其 它 模 块 共享 ， 比 如 select.c、update.c 和 
delete.c。 这 些 模 块 调用 sqlite3WhereBegin() 开 始 WHERE 语 名 块 的 指令 生成 ， 然 后 将 返回 的 
代码 加 入 到 它们 自己 的 VDBE 代 码 中 ， 最 后 调用 sqlite3WhereEnd()， 生 成 结束 WHERE 子 句 代 
码 的 VDBE 指 令 。 程 序 的 一 般 结 构 如 图 9-9 所 示 : 


VDBE Program 


, For each row that matches the 
sqlite3WhereBegin() ——> WHERE expression 


SELECT/UPDATE/DELETE ——> Do something with row 


sqlite3WhereEnd() —————}> End WHERE Loop 


A 9-9 WHERE f 4) 4) VDBE 1X45 44) Æ X, 优化 发 生 在 sqlite3WhereBegin() 阶 段 。 它 在 已 完成 工 
作 的 基础 上 ， 寻 找 可 以 使 用 的 索引 ， 寻 找 可 以 重 写 的 表达 式 ， 等 等 。 为 了 能 对 优化 先 有 一 个 
感觉 ， 我 们 从 一 个 不 含 WHERE 子 甸 的 简单 SELECT 语句 开始 ， 如 图 9-10 所 示 : 


SQLite 权威 指南 


sqlite» explain SELECT name FROM episodes; 
ir opcode pl p2 ps 





9 0 

18 Transaction 0 8 
11 VerifyCookie 0 14 
12 Goto 8 1 
13 Noop 0 0 


图 9-10 —4- 4 $ WHERE f 4) SS SELECT 4) 
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